跳到主要内容

市场

不确定中的信号

一份关于如何区分稳健信号与叙事噪音的研究笔记 —— 什么让一个信号具备信息含量、可被证伪、并与决策相关。

市面上被当作”市场信号”的内容,多数是同义反复、叙事,或过拟合。一个稳健的信号需要通过三项检验:机制上立得住、事前可被证伪、并且在与决策匹配的规模上能影响决定。多数公开发布的指标至少在其中一项上失败。

哪些 不是 信号

以下几类常常被当成信号,但不应该是:

  • 故事形态的相关性。 两条序列在若干年里同向移动 —— 没有机制的支撑,这只是一个观察,而不是信号。
  • 被反复重述的常识。 “流动性很重要。""持仓很重要。""情绪很重要。“这些是研究框架,不是信号。它们要成为信号,必须明确 是哪一种流动性、哪一种持仓、哪一种情绪,按什么口径度量
  • 基于回望式再平衡的指标。 用同一窗口调参再回测的东西,是描述,不是预测。
  • 滞后确认。 行情发生之后才触发的信号,不是信号,是事后记录。

一个有用的信号长什么样

只有当具备以下四项性质时,一个观察才配被叫作信号:

  1. 机制。 一条不一定完美、但可以拿出来讨论的理由,把观察值与某种行为或制度驱动连起来。机制可以错,但必须可以被检验。
  2. 事前明确的证伪规则。 “如果 X 在 Z 时点之前到达 Y 水平,而预期效应没有出现,则该信号被证伪。“没有这一条,信号无法衰减;任何失误都能事后合理化。
  3. 足够的提前量。 信号必须早到足以在相应规模上可操作。如果它正好在拐点上触发,那它和价格本身没有区别。
  4. 对小幅口径变化的稳健性。 同一个想法,换一种略有不同的口径测度,若得到完全不同的历史曲线,那就是拟合到自己的定义上,而不是拟合到现象上。

自反性是最难的情形

最重要的信号,往往带有自反性:观察或交易这个信号本身,会改变底层结构。持仓数据、资金流类指标、叙事动量类度量,都具有这一性质。它们仍然可用,但需要做一个结构性调整:问题不再是”这个信号在说什么”,而是”在多数参与者都在看它的前提下,这个信号还在说什么”。

一个有用的测试:如果所有能看到这个信号的人同时按它交易,原来的机制是否还成立?如果不成立,这个信号靠的是自己的流行度,而其半衰期会比回测显示的更短。

决策相关性

一个机制干净、统计稳健、可被证伪的信号,仍然可能在决策的相应规模与时间窗口上毫无用处。纪律是: 界定决策,再问任何候选信号在那个时间窗与那种把握度下是否具有信息含量。反过来收集信号、再寻找决策,会产生看起来有趣但很少能用的分析。

我们在内部如何使用这一框架

在任何指标进入研究输出之前,我们会做一次例行检查:

  • 机制是什么?
  • 怎么样可以判定它已经失效?
  • 在决策时间窗口下,它是领先、同步还是滞后?
  • 在不同窗口下、用相同口径测量,它是否依然成立?
  • 我们关注它,是因为它本身具有信息含量,还是因为别人也在关注?

这套筛选输出的信号比起初的候选集合小很多 —— 这件事本身,已经传达了一条信息:公开评论中有多大比例承担了它实际配不上的权重。