为什么交易者不能忽视相关性——以及它的实际运作方式

在构建投资组合时,大多数投资者认为多元化仅仅是混合不同资产类型。但他们常常忽视决定这些资产是否真正独立变动的隐藏关系:相关性。理解这一指标可能是对冲头寸与灾难之间的关键差异。

相关性真正告诉你什么

从本质上讲,相关系数是一个单一指标——介于-1到1之间的数字——用以量化两个变量的变动紧密程度。可以将其看作关系模式的调速旋钮。接近1的值意味着它们同步上涨和下跌;接近-1意味着它们呈相反方向变动;大约0则表明几乎没有可预测的联系。

对于交易者而言,这很重要,因为它决定了额外资产实际上能在多大程度上降低投资组合风险。两个回报相同的股票,其表现可能截然不同,取决于它们的相关结构。在将股票与债券、商品或另类资产结合时亦是如此。

大陷阱:相关性不等于因果关系

许多投资者在这里犯错。两个资产一起变动,并不意味着其中一个导致另一个。第三个因素——利率、地缘政治事件、行业趋势——可能同时驱动两者。识别这一区别可以防止你构建脆弱的对冲,或误以为关系会持续,实际上基础驱动因素发生变化。

在市场压力期间尤为关键。平静时期看似弱相关的关系,在波动性激增时可能完全消失,让你在最需要多元化时变得毫无防护。

如何衡量:三大主要方法

皮尔逊相关系数是标准。它通过将两个连续变量的协方差除以它们标准差的乘积,衡量线性关系。公式简单:相关性 = 协方差(X, Y) / (SD(X) × SD(Y))

这种标准化让你可以在不同资产对和市场之间进行一致的比较。

但皮尔逊有盲点:它只捕捉线性关系。如果两个变量以曲线或阶梯式模式共同变动,皮尔逊会显示较弱的相关性,即使实际上存在强关联。这时斯皮尔曼肯德尔相关系数就派上用场了。这些基于秩的指标能捕捉单调关系,更适合非正态分布或样本较小时使用。

选择合适的指标很重要。股票和流动性资产用皮尔逊。处理序数数据或关系非线性时,切换到斯皮尔曼或肯德尔。

读懂相关性数值:背景至关重要

大多数分析师使用的粗略基准:

  • 0.0到0.2:几乎没有关系
  • 0.2到0.5:弱相关(通常不够稳定,不能可靠对冲)
  • 0.5到0.8:中等到强
  • 0.8到1.0:非常强的关联

负值遵循相同的尺度,但表示反向变动。相关性-0.7意味着相当强的负相关——对冲时常常是理想的。

但问题在于:“强”的定义因情境而异。物理实验室要求相关性接近±1才算显著。金融市场则不同。即使两个资产类别的相关性很弱,只要规模足够,也能显著降低组合波动。

样本规模决定一切

相关系数在10个数据点和10,000个数据点时看起来完全一样,但其可靠性天差地别。样本少时,即使是中等数值也可能纯属偶然。样本多时,即使是温和的值也具有统计意义。

尤其在数据有限时,务必检查p值或置信区间。来自100个观察值的弱相关性,比来自20个观察值的相同数值更具参考价值。

真实投资中的相关性:三个实用例子

股票与债券: 历史上,美国股票与政府债券表现出低或负相关性,是经典的多元化工具。但这种关系并非一成不变。在某些时期,尤其是滞涨时期,这种关系会剧烈崩溃。

石油公司与原油价格: 直觉认为能源股应紧跟油价。长期数据显示,相关性仅为中等,且极不稳定。公司特定因素、炼油利润率和地缘政治对冲会制造噪音。

商品对: 一种金属的价格变动对另一种的预测能力有限,尽管交易者常常假设相反。需求动态、供应冲击和货币波动会形成弱相关结构,令人难以用简单的对冲策略应对。

关键教训:相关性在危机中会发生变化。你最需要对冲时,既有关系往往会失效。这也是专业人士定期重新计算滚动窗口相关性,并在历史模式变化时调整仓位的原因。

数学背后(简化版)

想手动验证结果的读者,可以用以下基本逻辑:

取两个数据序列X和Y。计算它们的均值。每个观察值减去均值,得到偏差。将配对偏差相乘并求和(这是协方差的分子)。然后计算每个序列的标准差。用协方差除以标准差的乘积,即得相关系数r。

如果Y与X成比例上升,结果接近1;如果一升一降,接近-1。大多数实际金融数据会落在中间。

实际上,你不会手算。Excel可以瞬间完成这些运算。

在Excel中计算相关性

Excel提供两种简单方法:

单对数据:=CORREL(范围1, 范围2),即可立即返回皮尔逊系数。

多资产对同时计算:使用数据分析工具包(Analysis Toolpak)。启用后,选择“数据”>“数据分析”>“相关性”,输入你的范围,工具会生成一个显示所有配对相关性的矩阵。

技巧:仔细对齐数据,正确处理标题(勾选“第一行包含标签”),在信任结果前检查原始数据中的异常值。单个极端值可能会大幅扭曲相关系数。

R与R平方:不同工具,适用不同场景

R是相关系数本身,显示线性关系的强度和方向。

R平方是R的平方,表示一个变量的方差中有多少可以由另一个线性回归解释。如果R=0.7,则R²=0.49,意味着Y的变动中有49%可以用X预测。

可以这样理解:R告诉你点在一条线(正或负斜率)周围的聚集程度;R平方告诉你用X可以解释Y的涨跌的比例。

相关性失效的情况

避免的最大陷阱:

非线性关系表现为弱相关: 两个变量可能以曲线方式共同变动。皮尔逊会显示弱相关,但实际上它们关系密切。务必先用散点图观察。

异常值扭曲一切: 一个极端观察值可能让相关系数剧烈偏离。筛查数据,判断异常值是否为真实信号或测量误差。

假设被违反: 非正态分布、类别变量或秩次数据都违反了皮尔逊的假设。应使用其他指标。

相关性不稳定: 市场环境变化。去年有效的对冲,今年可能失效。定期重新计算,并在策略中加入弹性。

结论

相关系数是理解资产关系的实用起点。它将复杂的关系压缩成一个易于解释的数字。但将其视为全部信息是危险的。

结合可视化(散点图)、统计显著性检验、异常值检测,以及关系演变监控,才能全面理解。用相关性生成假设,而非绝对结论。某些情况下,弱相关仍有价值;而强相关在危机中可能一夜之间消失。

最终获胜的投资者,不是找到“完美”的相关系数,而是懂得其局限性,并据此调整思路。

WHY-2.68%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)