複製鏈接
請複製以下鏈接發送給好友

費雪變換

鎖定
費雪變換(英語:Fisher transformation),是統計學中用於相關係數假設檢驗的一種方法 [1] 
中文名
費雪變換
外文名
Fisher transformation
學    科
統計學
用    途
相關係數假設檢驗的一種方法

費雪變換簡介

費雪變換(英語:Fisher transformation)是統計學中用於相關係數假設檢驗的一種方法。對樣本相關係數進行費雪變換後,可以用來檢驗關於總體相關係數ρ的假設。 [1] 

費雪變換定義

已知N組雙變量樣本(Xi,Yi),i=1,...,N,樣本相關係數r
於是,r的費雪變換可定義為
當 (X,Y) 為二元正態分佈且 (Xi,Yi)對相互獨立時,z近似為正態分佈。其均值為
其中N是樣本大小,ρ 是變量XY的總體相關係數。
費雪變換及其逆變換
可以用於構造ρ的置信區間

費雪變換討論

當X和Y遵循二元正態分佈時,Fisher變換是r的近似方差穩定變換。這意味着對於羣體相關係數ρ的所有值,z的方差近似恆定。在沒有Fisher變換的情況下,r的方差隨着|ρ|變小由於Fisher變換大約是| r |時的恆等函數<1/2,有時候有必要記住r的方差很好地接近1 / N,只要|ρ|不是太大,N也不是太小。這與二元正態數據的r的漸近方差為1的事實有關。
自從費希爾於1915年引入這種變換以來,這種變換的行為已經得到了廣泛的研究。費舍爾自己在1921年發現了二元正態分佈數據的z的精確分佈; 1951年Gayen確定了來自雙變量A型Edgeworth分佈的數據的z的精確分佈。 1953年霍特林計算了z的矩和泰勒級數表達式以及幾個相關的統計量,而霍金斯在1989年發現了具有有界四階矩的分佈數據的z的漸近分佈。

費雪變換應用

雖然Fisher變換主要與雙變量正態觀測的Pearson積矩相關係數有關,但在更一般的情況下,它也可以應用於Spearman秩相關係數。類似結果對於漸近分佈適用,但需要較小的調整因子。

費雪變換各種相關係數

對於不同測量尺度的變數,有不同的相關係數可用:
  • Pearson相關係數(Pearson'sr):衡量兩個等距尺度或等比尺度變數之相關性。是最常見的,也是學習統計學時第一個接觸的相關係數。
  • 淨相關(英語:partial correlation):在模型中有多個自變數(或解釋變數)時,去除掉其他自變數的影響,只衡量特定一個自變數與因變數之間的相關性。自變數和因變數皆為連續變數。
  • 相關比(英語:correlation ratio):衡量兩個連續變數之相關性。
  • Gamma相關係數:衡量兩個次序尺度變數之相關性。
  • Spearman等級相關係數:衡量兩個次序尺度變數之相關性。
  • Kendall等級相關係數(英語:Kendall tau rank correlation coefficient):衡量兩個人為次序尺度變數(原始資料為等距尺度)之相關性。
  • Kendall和諧係數:衡量兩個次序尺度變數之相關性。
  • Phi相關係數(英語:Phi coefficient):衡量兩個真正名目尺度的二分變數之相關性。
  • 列聯相關係數(英語:contingency coefficient):衡量兩個真正名目尺度變數之相關性。
  • 四分相關(英語:tetrachoric correlation):衡量兩個人為名目尺度(原始資料為等距尺度)的二分變數之相關性。
  • Kappa一致性係數(英語:K coefficient of agreement):衡量兩個名目尺度變數之相關性。
  • 點二系列相關係數(英語:point-biserial correlation):X變數是真正名目尺度二分變數。Y變數是連續變數。
  • 二系列相關係數(英語:biserial correlation):X變數是人為名目尺度二分變數。Y變數是連續變數。

費雪變換參見

參考資料
  • 1.    Fisher, R.A. Frequency distribution of the values of the correlation coefficient in samples of an indefinitely large population. Biometrika (Biometrika Trust). 1915, 10 (4): 507–521.