為什麼你的投資組合策略需要R平方(以及為什麼僅僅依靠相關性是不夠的)

快速解答:有何不同?

當你分析兩個資產是否同步移動時,你會聽到交易者提到兩個術語:相關係數和R平方。它們相關但傳達的訊息截然不同。相關係數®的範圍從-1到1,顯示兩個變數的緊密程度以及其方向。R平方(R²)則是該數字的平方,揭示可以預測另一個變數變動的百分比

這樣想:相關係數0.8聽起來很強,但相同關係的R²只有0.64——意味著只有64%的價格變動可以被解釋。剩下的36%?是隨機且不可預測的噪音。

相關性實際運作原理(運作機制)

本質上,相關性將複雜的關係濃縮成一個數字。這個數字介於-1到1之間。接近1的值代表變數同步上升或下降。接近-1則代表相反。圍繞0的值?表示沒有可靠的線性關聯。

其數學公式:相關係數 = 協方差(X, Y) / (標準差(X) × 標準差(Y))

這個公式做了一件關鍵的事:它標準化了雜亂的數據,讓你可以比較不同規模或單位的資料。沒有標準化,將股票的相關性與比特幣比較,或與原油比較,毫無意義。

三大類型 (以及何時使用)

皮爾森相關係數在金融與資料科學中佔主導地位。它捕捉連續變數之間的直線關係。但如果資料呈曲線或階梯跳動,皮爾森會欺騙你——在實際存在強烈關聯時,卻顯示弱相關。

斯皮爾曼和肯德爾則用排名取代原始數值。當資料非正態分佈、含有離群值或呈序數等級時,它們是你的好朋友。樣本較小?斯皮爾曼比皮爾森更可靠。

選錯測量方式是陷阱。高皮爾森值只證明線性運動。若忽略了潛在的非線性關係,你的投資組合可能在你以為已對沖時崩潰。

解讀數字:0.6到底代表什麼?

雖然有指導方針,但情境勝於死板規則:

  • 0.0到0.2:幾乎沒有關係。擲硬幣的模式都比這更明顯。
  • 0.2到0.5:弱相關。偶爾一起動,但不可靠。
  • 0.5到0.8:中等到強烈。值得追蹤的關聯。
  • 0.8到1.0:非常強烈。幾乎同步。

負值的解讀相同——只是相反。一個-0.7的相關性表示相當強的反向運動,對對沖很有用。

但這裡的陷阱是:不同領域對閾值的接受標準不同。物理學要求相關性接近±1才算“真實”。金融和社會科學則接受較低的值,因為現實世界的複雜性更高。在市場心理學中,0.4的相關性可能已經很重要;在粒子物理學中,則可能只是噪音。

樣本數問題(或者:為何你的結果可能是垃圾)

用5個資料點計算的相關性與用500個資料點計算的結果,數值相同卻意義天差地遠。

樣本較小時,即使相關係數是0.6,也可能只是統計噪音——偶然的巧合。樣本較大時,即使只有0.3,也可能具有統計意義且是真實的。

判斷相關性是否重要,要看p值或信賴區間。p值低於0.05表示這關係不是純粹運氣。但p值本身也依賴樣本大小,所以不要盲目迷信。

相關性失靈的地方:注意事項

相關≠因果:兩個變數一起變可能是因為第三個隱藏因素在推動。油價與航空股常相關,但都不是彼此的因果——燃料成本推動兩者。若忽略這點,會建構出糟糕的對沖策略。

皮爾森對曲線無能為力:完美的S型關係在皮爾森中可能顯示為弱或接近零的相關性。你需要用斯皮爾曼或散點圖來捕捉皮爾森漏掉的關聯。

離群值是破壞者:一個極端值就能大幅改變相關性。移除一個資料點,整個結論可能翻轉。一定要先視覺化再相信數字。

制度轉變會毀掉一切:股票與債券的相關性曾經是負的——分散投資的夢想。後來兩者同時崩盤。用昨天的相關性來預測明天的投資組合,是金融上的失誤。

R平方:預測能力的衡量指標

這裡R平方成為實務中的重要工具。雖然相關性顯示方向與緊密程度,R²則量化預測能力的百分比。

如果你用線性模型擬合兩個變數,得到R²=0.64,代表你的因變數中有64%的變動可以由自變數解釋。剩下的36%來自其他因素、隨機或模型不當。

關鍵點:R²永遠不會超過相關係數的平方。0.8的相關性最大R²是0.64。許多交易者誤解這點,期待從強相關中得到完美預測——結果反而可能遭受損失。

利用相關性打造智慧投資組合

真正的投資者不會只算完相關性就放著。他們會策略性地運用:

分散投資:當股票與債券相關性低或負相關時,搭配能平滑投資組合的波動。在股市崩盤時,債券常反彈,緩衝損失。

配對交易:量化交易者利用高相關資產的暫時偏離,押注它們會再度收斂。

因子曝險:不同風險因子(價值、動量、規模)與大盤指數的相關性不同。理解這些關係,有助於建立平衡的曝險。

對沖決策:需要對沖油價風險?找一個與原油負相關的資產。但要確認相關性穩定——如果在市場恐慌時消失,你的對沖就沒用了(市場恐慌)。

穩定性問題:相關性何時會背叛你

相關性不是固定不變的——它會隨著市場制度、政策變動和科技革新而轉變。一個持續五年的相關性,可能一夜之間就消失。

監控滾動窗口相關性(計算移動時間段內的相關性),以捕捉趨勢與制度變化。如果你的策略依賴穩定的關係,應定期重新計算。忽略相關性衰退,會讓你“完美的對沖”在危機來臨時毫無用處。

實務建議:在相信任何相關性前

  1. 先視覺化:散點圖能揭示數字看不到的模式。隨機點的雲?你的相關性在說謊。

  2. 找離群值:辨識並決定是否保留、移除或調整極端值。一個離群點就能翻轉整個結論。

  3. 配對方法與資料匹配:正態分佈的連續資料?用皮爾森。序數或非正態分佈?用斯皮爾曼或肯德爾。

  4. 檢驗統計顯著性:不要只看數字,要看p值,尤其樣本少時。

  5. 追蹤穩定性:用滾動窗口觀察相關性變化。若大幅轉變,你的策略就該重新調整。

  6. 定期重新計算:資料不斷更新。依照市場狀況與決策頻率,每月或每季更新一次。

總結

相關係數與R平方是強大的診斷工具,但不是預知未來的水晶球。相關係數告訴你兩個變數的同步程度,R平方則說明你能預測的比例。兩者都不能證明因果,對非線性關係都無能為力,也都在市場制度轉變時崩潰。

將它們作為起點——搭配散點圖、專業知識與其他統計方法。檢驗顯著性、監控穩定性,並對過於完美的關係保持懷疑。這份懷疑,正是讓交易者能理解這些指標、避免被現實打臉的關鍵所在。

WHY1.74%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)