"负面结果不是失败——它是一种比正面结果更有价值的发现。"
读完这篇文章你将理解为什么"直觉上应该有效"的策略在数据中未必有效,以及负面研究结果为什么比漂亮的回测更有价值
如果你投资有色金属行业的股票,你可能会想到一个看似合理的策略:铜期货价格上涨,意味着铜矿公司的产品更值钱了,利润增加,股价应该跟着涨。所以,如果你在铜期货上涨趋势确认时买入铜矿股,是否能够获得比"不看期货直接买"更高的胜率?
这个想法的逻辑链是清晰的:上游商品价格影响下游企业利润,企业利润影响股票价格。如果你能提前从期货市场"读取"商品价格的方向,你就拥有了一个领先指标。这听起来很有道理。
但这个策略值得测试。而测试的结果可能会让你感到失望——但正如我们将要看到的,这种失望本身就是最有价值的发现。
实证结果:改善有限且统计上不显著
一项针对A股上市公司的实证研究测试了以下框架:首先识别上游商品(铜、铝、钢铁、原油、大豆等)的期货价格趋势;然后在期货趋势向上时只做多对应的下游股票,在期货趋势向下时不做多;最后与"不使用期货过滤器"的基准策略对比。
结果:使用期货过滤器后,策略的胜率改善了大约2到3个百分点(从55%提高到约57%到58%)。但这个改善在统计上不显著——它可能来自随机波动而非真实的信号。
换句话说,一个直觉上"应该有效"的策略,在实际数据中只显示了微弱的、不可靠的效果。这个发现本身就极有价值——因为它阻止了你在一个看似合理但实际无效的方向上投入宝贵的时间和资金——这本身就是一笔巨大的节省。
为什么"应该有效"的逻辑在实践中失效
第一个原因是符号反转。 "商品价格上涨利好下游"这个假设忽略了一个关键区分:生产者(铜矿公司)在铜价上涨时利润增加,但加工者(铜线缆制造商)在铜价上涨时原料成本增加、利润反而下降。同一个"铜价上涨"的信号,对上游生产者是利好,对下游加工者是利空。如果你的股票池混合了生产者和加工者——信号的方向就互相抵消了。这不是你能通过"调整参数"来解决的问题,而是这个分析框架的逻辑结构本身的局限性。你需要在构建股票池时就把生产者和加工者明确区分开来——但这增加了大量的前置工作和主观判断,而每一层额外的主观判断都引入了新的偏差来源和不确定性。
第二个原因是时滞不确定。 商品价格变化传导到企业利润,再传导到股票价格——这个过程的时滞是高度不确定的。有些公司用期货对冲锁定了未来6个月的原材料价格,短期的商品价格波动对它们的利润没有任何影响。有些公司与客户签了长期合同,即使原材料成本变了售价也无法立即调整。有些公司有大量库存,当期的利润反映的是3个月前的采购价格而非当前的即时市场价。这种不确定的时滞使得"期货趋势和股票趋势同步"的假设远不如直觉预期那么可靠。
第三个原因是参数过拟合陷阱。 要让期货过滤器"看起来有效",你需要选择很多参数:用多长的均线来定义期货趋势?用多大的阈值来确认趋势?期货数据领先多长时间才最有参考价值?每一个参数的选择都增加了过拟合的风险。你可以通过调整这些参数让历史回测的结果"完美"——但这些参数在未来很可能完全失效,因为它们捕捉的是过去数据中的随机噪音而非可以在未来重复出现的真实规律。这是量化投资中最常见也最隐蔽的陷阱——你的回测越"完美",你应该越怀疑它。
负面结果的价值:知道"什么不行"和知道"什么行"一样重要
这项研究最重要的发现不是"期货过滤器无效"——而是展示了负面结果在投资研究中的独特价值。
芒格说"告诉我我会死在哪里,然后我永远不去那个地方"——知道一个策略无效,和知道一个策略有效一样有价值。这个负面结果帮你避免了在一个"看起来合理但实际无效"的复杂策略上浪费时间和资金。它揭示了"直觉"和"数据"之间的差距——逻辑上说得通的策略在数据中未必有效。格雷厄姆说"向后看可能弊大于利"——你的直觉就是一种"向后看",基于你过去的经验构造的逻辑。只有通过前瞻性的数据验证,你才能区分"真正有预测力的规律"和"让你感觉良好的噪音"。
这项研究还建立了一个重要的方法论标准:在你的策略中增加任何新的条件(无论是期货过滤器还是其他什么),你必须证明它带来的改善是统计显著的。如果改善不显著,这个条件就只是增加了复杂性而没有增加价值。奥卡姆剃刀原则告诉你:在解释力相同的情况下,选择最简单的模型。在投资策略中,这意味着:如果一个简单的策略和一个复杂的策略表现差不多,永远选简单的那个——因为简单的策略更不容易在未来失效。
什么时候期货价格信息真的有用
虽然作为"个股方向性过滤器"效果有限,但期货价格在宏观层面仍有重要的投资价值。
第一个有效场景是判断经济周期阶段。 铜、原油、大豆等商品价格的整体趋势反映了全球实体经济的需求强度。商品价格全面上涨可能意味着处于经济扩张晚期。商品价格全面下跌可能接近衰退。这不是用来做个股交易的——而是用来判断你应该在哪个行业增加配置或减少配置。
第二个有效场景是作为通胀先行指标。 商品价格上涨可能预示未来6到12个月的通胀上升,央行可能因此加息,对利率敏感的行业(房地产、公用事业、长期债券)可能受到压力。这种宏观层面的判断不需要高精度——"通胀在上升还是在下降"是一个粗略的方向性判断,不容易过拟合。
第三个有效场景是对特定事件的快速反应。 当发生地缘冲突时,原油期货的反应通常比石油股更快——因为期货市场几乎24小时交易且流动性更高。你可以用期货的即时反应来评估"这个事件对能源行业的影响程度",并据此在股票开盘前做好心理和仓位上的准备。但需要注意的是,这种用法是定性的("影响有多大")而不是定量的("应该买入多少")。定性判断对精度的要求远低于定量交易,因此过拟合的风险也小得多。
评估新策略条件的检查清单
下次你在考虑给投资策略添加一个新的"过滤条件"(比如期货信号、新闻情绪、技术指标等)时,用以下4个问题来评估它是否值得:
- 改善是否统计显著? 在至少3年的跨年数据中测试,改善幅度是否超过了随机波动的范围?如果只有2到3个百分点的改善且置信度不高,大概率是噪音。
- 改善是否来自逻辑还是来自参数调整? 如果你需要用特定的均线长度、特定的阈值和特定的滞后天数才能让它"有效"——这大概率是过拟合而不是真实信号。
- 添加这个条件增加了多少复杂性? 每增加一个参数就多一个过拟合的维度。简单策略在实践中几乎总是比复杂策略更稳健。
- 如果去掉这个条件,损失有多大? 如果去掉后策略表现几乎没有变化——那它就是不必要的复杂性,应该果断删除而不是"留着以防万一"。
巴菲特的90/10遗嘱配置只用两只基金,极致简单但长期有效。施洛斯的方法只看一个指标(股价低于净资产),47年年化16%。当你发现一个"复杂"的策略只比"简单"的策略好2到3个百分点时,那2到3个百分点大概率是噪音,而你为此增加的复杂性可能带来更多的过拟合风险。
常见问题
这个研究是否意味着"跨市场分析"完全没用?
不是——它只是说"用期货趋势过滤个股交易"的效果有限。跨市场分析在宏观层面(判断经济周期阶段、识别通胀趋势)仍然非常有价值。关键区别在于精度要求:宏观判断不需要高精度("经济在扩张还是收缩"是一个粗略的判断,不容易过拟合),而个股过滤需要高精度("这只铜矿股明天涨还是跌"极容易过拟合)。在你不确定某个跨市场信号是否有效时,先问自己:这个信号用在宏观层面还是个股层面?前者有希望并且在实践中已经被证明是有价值的判断工具,后者则需要远比大多数人意识到的更严格的统计验证才值得采用。在投资中,对精度的要求越高,过拟合的风险越大,策略的实际有效性越难保证。
如果期货过滤器对个股无效那对行业指数基金有效吗?
可能更有效,但仍需独立验证。行业指数基金已经自动"混合"了上游生产者和下游加工者,部分消除了符号反转的问题。但时滞不确定性和参数过拟合的风险仍然存在。建议:如果你想用期货信号指导行业指数基金的配置,做至少3年的跨年验证。如果跨年后改善仍不显著,简化你的策略,删掉期货过滤器——模糊的正确胜过精确的错误。
本文参考A股上下游传导量化研究整理,不包含具体策略细节。所有分析仅为方法论教育目的。如果这篇文章帮你理解了"负面结果"为什么比"漂亮的回测"更有价值,欢迎关注公众号「柔和谦卑 履责 求知」。
不构成投资建议。
「柔和谦卑 履责 求知」