解碼數據與市場中的相關性

為何交易者關心相關性

在投資中,相關係數是一個管理投資組合風險和檢測資產之間關係的關鍵工具。這個單一指標——範圍從 -1 到 1——告訴你兩個證券的走勢有多緊密地同步。相關性低或為負的資產有助於分散持倉,而高度相關的資產則會放大波動性。對於量化分析師和投資組合經理來說,了解哪些股票、債券或商品的走勢是(一起)或相反,直接影響對沖策略和倉位規模。

基礎知識:相關係數衡量的是什麼

從本質上來說,相關係數將兩個變數之間的關係壓縮成一個易於比較的數值。接近 1 的值表示兩個變數同步上升和下降。接近 -1 的值則表示它們呈相反方向運動。圍繞 0 聚集的數值則暗示著線性關聯較弱。

這個指標的美妙之處在於標準化。不論是比較不同貨幣對、商品期貨或股票指數的價格變動,-1 到 1 的尺度都能讓不同單位或數值範圍的資料直接比較。

三種主要方法:皮爾森、斯皮爾曼與肯德爾

皮爾森相關係數在金融分析中佔主導地位。它能精確衡量兩個連續變數之間的線性關聯。然而,它假設線性關係,這可能是限制。

當關係是單調但非嚴格線性,或資料中含有離群值和非正態分布時,斯皮爾曼等級相關就更可靠。這種基於排名的方法能辨識一個變數相對於另一個的升降是否一致,而不假設完全線性。交易者在分析價格行為不規則或市場壓力期間,常偏好使用斯皮爾曼的等級相關。

肯德爾的tau則提供另一種基於排名的替代方案,特別適用於樣本較小或資料中有許多平手值的情況。當傳統假設不成立時,這兩種基於排名的測量都比皮爾森更優。

選擇合適的方法很重要:高皮爾森值僅證明線性關聯。曲線或閾值依賴的關係若不轉用斯皮爾曼或其他非參數技術,則無法察覺。

背後的數學

皮爾森公式看似簡單:

相關係數 = 協方差(X, Y) / (標準差(X) × 標準差(Y))

這個標準化過程將依賴單位的協方差轉換成範圍在 -1 到 1 之間的尺度。

進行範例計算

取四個配對觀測值:

  • X:2, 4, 6, 8
  • Y:1, 3, 5, 7

**步驟1:**計算平均值。X的平均為5;Y的平均為4。

**步驟2:**計算每個值與平均值的偏差。

**步驟3:**將配對偏差相乘,並求和,得到協方差的分子。

**步驟4:**將每個偏差平方,分別求和,再開根號,得到標準差。

**步驟5:**用協方差除以兩個標準差的乘積。

在此例中,r趨近於1,因為Y與X成比例上升。實務上,統計軟體能立即完成這些計算,但理解其邏輯有助於避免誤解。

解讀數字:基準閾值

沒有一個普遍的界線能明確區分「弱」與「強」,但常用的參考點包括:

  • **0.0 至 0.2:**幾乎無關聯
  • **0.2 至 0.5:**較弱的關係
  • **0.5 至 0.8:**中等到較強的關聯
  • **0.8 至 1.0:**非常強的連結

負值則沿用相同尺度,但代表相反運動。-0.7 的相關性表示相當強的負相關。

情境非常重要。物理學要求相關性接近 ±1 才有意義。金融市場因噪音較多,較低的相關值也可能具有意義。社會科學的標準則更低。

投資中的相關性:實務應用

###經典配對

**股票與債券:**美國股票與政府債券歷史上呈低或負相關,能在股市下跌時提供緩衝。

**油企:**直覺認為油企回報與原油價格密切相關,但資料常顯示僅為中度且不穩定的相關性——提醒我們簡單的關係常會誤導。

**貨幣交易:**不同貨幣對的相關性會根據經濟週期、央行政策和資金流動而變化。

###策略性應用

相關性用於配對交易(利用暫時偏離)、因子投資(管理系統性風險),以及統計套利(尋找錯價關係)。量化團隊持續監控歷史相關性是否成立,並在關係崩壞時調整倉位——尤其在危機期間,分散化的好處往往在最需要時消失。

必須避免的陷阱

**相關≠因果:**兩個變數一起變並不代表一個造成另一個。可能有第三個因素在推動兩者。

**皮爾森忽略曲線:**強烈的曲線關係在皮爾森分析下可能顯得相關性較弱。斯皮爾曼常能揭示隱藏的非線性關聯。

**離群值扭曲結果:**單一極端數據點就能大幅改變 r,故在資料中有雜訊時,排名法較為穩健。

**樣本數重要:**樣本太少會導致不可靠的相關性。10 筆資料與 10,000 筆的數值意義截然不同。

**分布需符合:**非正態資料、類別變數或序數尺度都違反皮爾森假設。此時應用列聯表或 Cramér’s V 等測量。

快速計算相關性

Excel 提供兩種簡單方法:

單一相關係數: =CORREL(範圍1, 範圍2) 即時回傳皮爾森 r。

**相關矩陣:**啟用分析工具庫,選擇「相關性」(Correlation),輸入範圍,即可得到所有系列的成對相關矩陣。

提示:範圍對齊要小心,留意標題欄,並在信任結果前先檢查資料中的離群值。

R 與 R 平方:了解差異

R (相關係數)顯示線性關係的強度與方向。-0.6 表示中等偏強且為負相關。

R平方 (R²) 將 R 的值平方。R² = 0.36 表示其中一個變數的變異有 36% 可由另一個線性預測。R² 表示解釋力;R 表示關聯的緊密程度及方向。

追蹤最新:何時重新計算

市場狀況會變。相關性在經歷危機、技術變革或經濟結構調整時可能崩潰。用過時的相關性來對沖或分散,效果會很差。

解決方案:每季或每有新資料時重新計算。更佳的是,使用滾動窗口相關性來追蹤趨勢,並在關係不穩時及時調整。這樣可以避免因過時假設而造成的投資損失。

依賴相關性前的檢查清單

  • 用散點圖檢查資料,確認線性關係合理
  • 檢查離群值,決定是否刪除或調整
  • 確認資料類型與分布符合所用相關方法
  • 進行顯著性測試,特別是樣本較少時
  • 監控滾動時間窗內的相關性穩定性
  • 若資料非正態或非線性,考慮使用斯皮爾曼等級相關

最終結論

相關係數是評估兩個變數關聯性的一個實用捷徑。它支援投資組合設計、風險管理與探索性分析。然而,它不是萬用靈藥。它無法建立因果關係,對非線性模式表現不佳,且易受樣本大小與離群值影響。

將相關性視為起點。結合散點圖、斯皮爾曼等級相關或顯著性測試,能建立更穩健、更具韌性的決策。在市場中,這種紀律性的方法常能將獲利策略與代價高昂的錯誤區分開來。

IN1.68%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)