解碼兩個變數如何共同變動:相關係數的實用指南

基礎知識:什麼是相關係數?

本質上,相關係數是一個單一的數值摘要,告訴你兩個資料集是否以及如何同步變動。這個值始終落在 -1 到 1 的範圍內。當它接近 1 時,兩個變數一起上升與下降;當它接近 -1 時,則呈現相反方向移動。值接近 0 表示它們之間幾乎沒有線性關聯。

為什麼這很重要?因為將複雜的關係簡化成一個可解讀的數字,可以節省時間並支持更好的決策——無論你是在建立投資組合、管理風險,或是在探索兩個變數是否真的相關。

你應該使用哪種相關測量方法?

並非所有相關方法都一樣。最常見的是皮爾森相關係數,用來追蹤兩個連續變數是否沿直線變動。然而,如果關係不是線性的,皮爾森可能會誤導你。

你的選擇包括:

  • 斯皮爾曼相關:使用排名而非原始數值,非常適合序數資料或偏離常態分布的資料。
  • 肯德爾相關:另一種基於排名的方法,特別適用於樣本較小或有許多相同值的情況。

重點是:皮爾森擅長線性關係,但如果散點圖顯示曲線或階梯型,應改用基於排名的測量。選錯工具可能會錯過真正的關聯。

相關係數的數學原理

皮爾森係數來自一個簡單的公式:

相關係數 = 協方差(X, Y) / (X的標準差 × Y的標準差)

這個分數——協方差除以標準差的乘積——將結果標準化到 -1 到 1 的範圍,使得不同單位的資料也能進行比較。

( 具體範例說明

假設有四個配對觀測值:

  • X:2, 4, 6, 8
  • Y:1, 3, 5, 7

計算步驟包括:

  1. 計算平均值:X平均為5,Y平均為4。
  2. 計算偏差:每個值減去平均值(例如,2−5=−3)。
  3. 將配對偏差相乘並相加,得到協方差的分子。
  4. 將每個偏差平方,分別相加,然後開根號得到標準差。
  5. 用協方差除以兩個標準差的乘積,即得相關係數r。

在這個例子中,r會接近1,因為Y與X同步上升。實際資料由軟體處理,你只需提供數據,它會回傳r。

如何解讀相關係數:數字代表什麼?

一般來說,絕對值的解讀範圍如下:

  • 0.0 至 0.2:幾乎沒有線性關聯
  • 0.2 至 0.5:弱線性關聯
  • 0.5 至 0.8:中等到相當程度的線性關係
  • 0.8 至 1.0:極強的線性相關

負值代表反向移動,例如−0.7表示相當強的負相關。

) 為什麼背景情境會影響這些閾值?

硬科學(如實驗物理)要求相關性接近 ±1 才能認為是真實的關聯。社會科學則標準較鬆,因為人類系統本身就很複雜。常問自己:在我的領域中,「有意義」的相關性是什麼?

樣本數與統計實務

用10個觀測值計算的相關性,遠不如用1,000個的可靠。小樣本會產生噪聲且不穩定。為判斷相關性是否反映真實結構或僅是偶然,應計算p值或信賴區間。大樣本即使相關性較低,也可能具有統計顯著性;小樣本則需要較高的相關係數才能達到顯著。

常見陷阱:即使是經驗豐富的用戶也會遇到

相關不代表因果。 兩個變數可能一起變動,是因為第三個因素影響了兩者。 皮爾森只適用線性模式。 如果關係是曲線或階梯型,皮爾森可能會顯示較弱的相關性。 離群值會造成嚴重干擾。 一個極端點就能左右整個相關係數。 資料非常態分布會違反假設。 對偏態、分類或序數資料,排名相關或列聯表更適合。

當皮爾森失效——例如,關係是單調但非線性時——建議使用斯皮爾曼的rho或肯德爾的tau。對分類變數,Cramér’s V也值得考慮。

在投資組合管理中的實務應用

投資者利用相關性來降低風險並提升多元化。兩個資產相關性低或負相關,合併後能降低整體波動性。這個原理推動了因子投資、配對交易和統計套利。

具體範例:

  • 股票與債券:美國股票與國債歷史上呈現弱或負相關,能在股市下跌時提供緩衝。
  • 油價與能源股:你可能認為油企回報與原油價格密切相關,但實證研究顯示相關性中等且隨時間變化。
  • 避險策略:交易者尋找負相關資產來對沖風險,但這些關係的穩定性是關鍵。市場崩潰時,這些關聯可能會消失。

**重要警告:**相關性會變。市場壓力常常破壞你原本依賴的多元化效果。定期重新計算並監控滾動相關,才能掌握最新狀況。

在Excel中計算相關係數

Excel提供便利工具:

  • 單一資料對:使用 =CORREL(range1, range2) 即可取得皮爾森相關係數。
  • 多組資料矩陣:啟用分析工具庫(Analysis ToolPak),選擇「資料分析」>「相關」,輸入範圍,Excel會產生完整的相關矩陣。

**專家提示:**仔細對齊範圍、標記資料,並在信任結果前檢查離群值。

R與R平方:有何差別?

相關係數R同時反映線性關係的強度與方向。**R平方(R²)**則是r的平方,表示在線性模型下,一個變數的變動中,有多少比例可以由另一個變數解釋。

實務上:R告訴你資料點多緊密地圍繞一條直線。R²則告訴你X可以預測Y的變動百分比。

何時重新計算?

相關性會變。新資料、經濟轉變、危機或科技突破都可能改變關係。對於依賴穩定相關性的策略,應定期更新計算,並用滾動視窗觀察趨勢。過時的相關性會導致錯誤的避險和分散。

在依賴相關性前的檢查清單

  • 用散點圖檢查線性關係是否合理。
  • 搜尋離群值,決定:刪除、調整或接受?
  • 確認資料類型與分布符合所選相關方法。
  • 特別是樣本較小時,驗證統計顯著性。
  • 使用滾動窗口追蹤相關性變化。

總結

相關係數將兩個變數的共同變動轉換成 -1 到 1 之間的單一數字。它在快速評估線性關聯方面表現出色,並支持投資組合建構與探索性分析。然而,它也有盲點:不能證明因果、對非線性模式無能為力,且受樣本大小與極端值影響。

將相關性作為你的起點,搭配散點圖、其他測量方法與顯著性檢定,建立堅實且有理有據的結論。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)