市场

不确定中的信号

一份关于如何区分稳健信号与叙事噪音的研究笔记 —— 什么让一个信号具备信息含量、可被证伪、并与决策相关。

市面上被当作”市场信号”的内容，多数是同义反复、叙事，或过拟合。一个稳健的信号需要通过三项检验：机制上立得住、事前可被证伪、并且在与决策匹配的规模上能影响决定。多数公开发布的指标至少在其中一项上失败。

哪些不是信号

以下几类常常被当成信号，但不应该是：

故事形态的相关性。 两条序列在若干年里同向移动 —— 没有机制的支撑，这只是一个观察，而不是信号。
被反复重述的常识。 “流动性很重要。""持仓很重要。""情绪很重要。“这些是研究框架，不是信号。它们要成为信号，必须明确 是哪一种流动性、哪一种持仓、哪一种情绪，按什么口径度量。
基于回望式再平衡的指标。 用同一窗口调参再回测的东西，是描述，不是预测。
滞后确认。 行情发生之后才触发的信号，不是信号，是事后记录。

只有当具备以下四项性质时，一个观察才配被叫作信号：

机制。 一条不一定完美、但可以拿出来讨论的理由，把观察值与某种行为或制度驱动连起来。机制可以错，但必须可以被检验。
事前明确的证伪规则。 “如果 X 在 Z 时点之前到达 Y 水平，而预期效应没有出现，则该信号被证伪。“没有这一条，信号无法衰减；任何失误都能事后合理化。
足够的提前量。 信号必须早到足以在相应规模上可操作。如果它正好在拐点上触发，那它和价格本身没有区别。
对小幅口径变化的稳健性。 同一个想法，换一种略有不同的口径测度，若得到完全不同的历史曲线，那就是拟合到自己的定义上，而不是拟合到现象上。

最重要的信号，往往带有自反性：观察或交易这个信号本身，会改变底层结构。持仓数据、资金流类指标、叙事动量类度量，都具有这一性质。它们仍然可用，但需要做一个结构性调整：问题不再是”这个信号在说什么”，而是”在多数参与者都在看它的前提下，这个信号还在说什么”。

一个有用的测试：如果所有能看到这个信号的人同时按它交易，原来的机制是否还成立？如果不成立，这个信号靠的是自己的流行度，而其半衰期会比回测显示的更短。

一个机制干净、统计稳健、可被证伪的信号，仍然可能在决策的相应规模与时间窗口上毫无用处。纪律是：先界定决策，再问任何候选信号在那个时间窗与那种把握度下是否具有信息含量。反过来收集信号、再寻找决策，会产生看起来有趣但很少能用的分析。

在任何指标进入研究输出之前，我们会做一次例行检查：

这套筛选输出的信号比起初的候选集合小很多 —— 这件事本身，已经传达了一条信息：公开评论中有多大比例承担了它实际配不上的权重。