夏普比率为什么容易被操控:通货膨胀过的胜率背后是什么
夏普比率(Sharpe Ratio)是投资界最常用的策略评估指标。它的计算方式很简单:
Sharpe = (策略回报 - 无风险利率)/ 策略回报的波动率
它衡量的是:每承担一单位风险,你获得了多少超额回报。夏普比率越高,风险调整后的表现越好。
听起来很客观。但夏普比率有一个致命弱点,而这个弱点被大多数使用它的人忽视了。
一、多重检验通胀
假设你是一个量化研究者。你测试了 1000 种策略——不同的参数、不同的指标组合、不同的持仓期。在这 1000 种策略中,你选出夏普比率最高的那一个,向外界展示。
这个”最高夏普”有多大的可信度?
远低于你以为的。
原因是统计学中的多重检验问题(Multiple Testing Problem):当你测试了大量假设时,纯粹靠运气也会出现”看起来很好”的结果。
一个类比:你掷一枚公平的硬币 10 次。如果你只掷一组——连续出现 10 次正面的概率极低(约 0.1%)。但如果你掷 1000 组——至少有一组出现 10 次正面的概率接近 100%。
策略测试也一样:如果你只测了一种策略,夏普 2.0 很可能是真实的。但如果你测了 1000 种、选了最好的——那个夏普 2.0 可能只是 1000 次”掷硬币”中碰巧表现最好的一次。
这就是夏普比率的”通货膨胀”:你报告的夏普比率被你没有报告的那些失败测试人为抬高了。你告诉别人”我找到了一个夏普 2.0 的策略”——但你没告诉他们你同时测了 999 个失败的策略。那 999 个失败是这个”成功”的隐性成本。
二、Deflated Sharpe Ratio(DSR)
2014 年,Marcos López de Prado 和 David Bailey 提出了 Deflated Sharpe Ratio(DSR)——一种校正了多重检验通胀的夏普比率。
DSR 的核心思想:你报告的夏普比率,需要根据你测试了多少种策略来”打折”。测的越多,需要打的折越大——因为”幸运地找到一个好策略”的概率越高。
DSR 考虑了以下因素:
- 你测试了多少种策略(trials)——测试越多,通胀越严重
- 策略回报的偏度和峰度——非正态分布的回报序列,夏普比率的可靠性更低
- 回测期的长度——数据越短,统计噪声越大
一个原始夏普 2.0 的策略,如果是从 1000 种策略中挑出来的——DSR 可能只有 0.3 或更低。0.3 的 DSR 意味着:这个策略的”好表现”大概率是运气,不是技术。
三、为什么这对所有投资者都重要
你可能觉得”我不做量化研究,DSR 跟我没关系”。但夏普比率通胀的逻辑适用于所有投资决策:
1. 基金经理的业绩展示
一家基金公司管理 50 只基金。其中 5 只表现不错。公司在宣传时只展示这 5 只——你看到的是 50 次”掷硬币”中最好的 5 次。幸存者偏差 + 选择性展示 = 你以为基金经理很厉害,实际上可能只是基数大。
2. 社交媒体上的”战绩”
一个人在社交媒体上分享”今年收益率 300%”——但你不知道他同时运营着 10 个账户,只晒了表现最好的那个。他的”300%”可能是 10 次实验中碰巧最好的那一次——他的真实平均水平可能是亏损的。
3. 你自己的投资复盘
你回顾过去一年的交易,发现”某类交易的胜率特别高”。但你可能无意识地做了多重检验:你回顾了多种交易类型、多种持仓期、多种市场环境——然后选择性地记住了胜率最高的那一类。你的”发现”可能只是从大量随机结果中挑出的幸存者。
四、如何自保
1. 问”测了多少”
当有人向你展示一个”高夏普策略”或”高胜率方法”时——问一个问题:你在找到这个之前测了多少种? 如果答案是”就试了这一种”——可信度高。如果答案是”我们从 500 种策略中筛选出来的”——你需要对报告的数字大幅打折。
2. 看样本外
任何策略的真实检验都应该在样本外数据上进行——即用策略被”发现”之后的新数据来验证。如果一个策略在 2018-2023 年的回测中夏普 2.0——但在 2024-2025 年的实盘中夏普只有 0.5——那个 2.0 大概率是过拟合的产物。
3. 警惕”数据挖掘”
现代计算能力让任何人都可以在几分钟内测试成千上万种策略。这使得”偶然发现好策略”的概率大幅上升。越是”测试方便”的环境,你越需要更严格的验证标准。
4. 多维度检验
不要只看夏普比率。同时看:
- 失败年份表现:最差的 2-3 年怎么样?
- 最大回撤:从峰值到谷底亏了多少?
- 回撤恢复时间:从最大回撤恢复到前高需要多久?
- 胜率在不同市场环境中的稳定性:牛市、熊市、震荡市分别怎么样?
单一指标(无论是夏普还是胜率)都可以被操控或被偶然性膨胀。多个指标同时好看——可信度才高。
五、从 DSR 到投资哲学
DSR 的核心教训不是一个数学公式——而是一种认识论的谦卑:
你看到的”好结果”可能只是大量尝试中碰巧幸存的那一个。
这和芒格说的”否认”(denial)有深层联系:人们不愿意承认自己的”好表现”可能部分或全部来自运气——所以他们把夏普比率当作”技术”的证明,而忽略了多重检验的影响。
Taleb 在《随机漫步的傻瓜》中描述了同样的现象:如果你让足够多的猴子随机选股,总会有一只”股神猴”——但它的成功完全是运气。问题是你无法在事前区分”股神猴”和”真正的投资者”——因为短期业绩看起来一模一样。
DSR 提供了一个数学工具来量化”运气成分”的大小。但即使没有这个工具,你也可以记住一个简单的规则:当有人展示一个看起来太好的结果时——问一句”你试了多少次才找到这个?”
这一句话,价值可能超过任何一个夏普比率。
FAQ
DSR 具体怎么计算?
完整公式涉及正态分布的逆函数和策略数量的对数调整——对非专业人士来说不太直观。核心概念是:用原始夏普比率减去一个”惩罚项”,惩罚项与测试次数的对数成正比。测试次数越多,惩罚越大,DSR 越低。详见 López de Prado & Bailey (2014), “The Deflated Sharpe Ratio: Correcting for Selection Bias, Backtest Overfitting, and the Role of Haircutting”。
普通投资者需要计算 DSR 吗?
不需要计算。但需要理解它的含义:任何从大量测试中选出来的”最佳策略”,其真实表现大概率不如展示的那么好。这个直觉在评估基金业绩、社交媒体交易战绩、以及你自己的交易复盘时都有用。
延伸阅读:关于高胜率在失败年份可能归零,在公众号搜索「高胜率不是护城河」。关于信号组合的三道验证门槛,搜索「信号叠加的三道门」。关于过拟合为什么简单系统比复杂系统更稳健,搜索「Donchian 通道」。
免责声明:本文不构成任何投资建议。DSR 和夏普比率的讨论仅供教育和方法论目的。
这个主题与你的投资体系有什么关系
投资不是一个个孤立知识点的集合,而是一套互相支撑的思维体系。本文讨论的主题是这个体系中的一个关键节点——它与你的风险管理、情绪控制、仓位决策和长期规划都有直接的关联。
具体来说,本文的核心观点可以在三个层面上改善你的投资实践。第一个层面是认知层:它帮你看到一个之前可能忽视的维度,扩展了你的决策视野。很多投资错误的根源不是分析能力不够,而是视野太窄——你在一个维度上做了完美的分析,但因为完全没考虑另一个维度而犯了致命的错误。本文提供的恰恰是这样一个”补充维度”。
第二个层面是行为层:它为你在特定场景下的行为提供了明确的指导。投资中最危险的时刻不是你不知道该怎么做的时刻,而是你以为自己知道但实际上被情绪误导的时刻。本文中的具体建议——如果你认真对待并写进你的投资规则——可以成为你在那些危险时刻的防线。
第三个层面是系统层:它帮你优化你整个投资流程中的一个环节。投资是一个长链条的过程,从信息获取到分析判断到执行决策到事后复盘,每一个环节都有可能出错。本文改善的是其中的特定环节,但因为链条的强度取决于最弱的环节,加固任何一个薄弱环节都会提升整体系统的可靠性。
最后,我想指出一个经常被忽视的事实:你花在阅读和思考上的时间,长期来看,对你投资回报的贡献可能远超你花在实际交易上的时间。巴菲特说他80%的工作时间在阅读和思考。这不是因为他懒,而是因为高质量的思考是高质量决策的前提,而高质量的决策是长期超额回报的唯一可持续来源。本文是你”思考时间”的一个投入,它的回报将在未来的某个决策时刻显现。
从本文到行动:一个简单的实践路径
如果你认同本文的观点但不确定如何将其融入日常投资实践,以下是一个简单的三步路径。
第一步:提炼你的”一句话原则”。回顾本文的核心论点,用你自己的语言把它浓缩成一句话。比如,”在别人恐慌时检查基本面而不是检查账户余额”,或者”真正的风险不是波动,是永久丧失购买力”。这句话必须是你自己写的,因为只有你自己写出来的原则才会在关键时刻真正影响你的行为。
第二步:把这条原则写进你的”投资检查表”。如果你还没有投资检查表,现在就创建一个——一张纸或一个手机备忘录,列出你在做任何投资决策之前必须过一遍的问题清单。你今天提炼出的这条原则,应该成为这个清单上的新一项。下次你准备买入或卖出任何东西时,先把这个清单从头到尾看一遍。
第三步:设定一个30天后的复盘提醒。在手机日历上标注一个30天后的提醒:”重读[本文标题],检查这条原则是否改变了我的任何行为。”30天后,如果你发现这条原则确实影响了你的至少一个决策,说明它已经从”知识”转化为”行为”——这是学习的真正完成。如果没有,思考原因:是原则本身不适合你,还是你在关键时刻忘了查看检查表?
投资的进步不是突然的顿悟,而是持续的微调。每篇好文章帮你做的一次微小校准,在复利效应下会累积成显著的方向差异。你今天的阅读就是这样一次微调。让它发挥作用的关键是:不要读完就关掉——把它变成你检查表上的一项具体条目。
自查清单:读完本文后问自己
- 本文的核心观点是否改变了你对某个投资问题的看法?如果是,具体改变了什么?
- 你当前的投资行为中,有哪一个与本文的建议矛盾?你打算怎么调整?
- 你能用一句话向别人解释本文的核心论点吗?如果不能,重读一遍核心章节。
延伸参考:Wikipedia
更多文章请访问 sustine.top 索引。