複製鏈接
請複製以下鏈接發送給好友

spearman相關係數

鎖定
統計學中, 以查爾斯·愛德華·斯皮爾曼命名的斯皮爾曼等級相關係數,即spearman相關係數。經常用希臘字母ρ表示。 它是衡量兩個變量依賴性的 非參數 指標。 它利用單調方程評價兩個統計變量的相關性。Spearman相關性的基本思想是:分別對兩個變量XY做等級變換(rank transformation),用等級RXRY表示;然後按Pearson相關性分析的方法計算RXRY的相關性 [1]  。 如果數據中沒有重複值, 並且當兩個變量完全單調相關時,斯皮爾曼相關係數則為+1或−1。
中文名
spearman相關係數
外文名
Spearman's rank correlation coefficient
定    義
衡量分級定序變量之間的相關程度
用    途
描述數據間的相關性

spearman相關係數定義和計算

斯皮爾曼相關係數被定義成等級變量之間的皮爾遜相關係數。對於樣本容量為n的樣本,n個原始數據被轉換成等級數據,相關係數ρ為
原始數據依據其在總體數據中平均的降序位置,被分配了一個相應的等級。如下表所示:
變量Xi
降序位置
等級xi
0.8
5
5
1.2
4
3.5
1.2
3
3.5
2.3
2
2
18
1
1
實際應用中,變量間的連結是無關緊要的,於是可以通過簡單的步驟計算ρ.被觀測的兩個變量的等級的差值,則ρ為

spearman相關係數相關度量

度量一對觀測數據的統計依賴性還有其他的幾種度量指標:在相關性和依賴性中有談及。其中最常用的是皮爾遜積矩相關係數。

spearman相關係數解釋

斯皮爾曼相關係數表明X(獨立變量)和Y(依賴變量)的相關方向。如果當X增加時,Y趨向於增加,斯皮爾曼相關係數則為正。如果當X增加時,Y趨向於減少,斯皮爾曼相關係數則為負。斯皮爾曼相關係數為零表明當X增加時Y沒有任何趨向性。當X和Y越來越接近完全的單調相關時,斯皮爾曼相關係數會在絕對值上增加。當X和Y完全單調相關時,斯皮爾曼相關係數的絕對值為1。完全的單調遞增關係意味着任意兩對數據Xi,Yi和Xj,Yj,有Xi−Xj和Yi−Yj總是同號。完全的單調遞減關係意味着任意兩對數據Xi,Yi和Xj,Yj,有Xi−Xj和Yi−Yj總是異號。
斯皮爾曼相關係數經常被稱作"非參數"的。這裏有兩層含義。首先,當X和Y的關係是由任意單調函數描述的,則它們是完全皮爾遜相關的。與此相應的,皮爾遜相關係數只能給出由線性方程描述的X和Y的相關性。其次,斯皮爾曼不需要先驗知識(也就是説,知道其參數)便可以準確獲取XandY的採樣概率分佈 [2] 

spearman相關係數顯著性的確定

一種確定被觀測數據的ρ值是否顯著不為零(r總是有1≥r≥−1)的方法是計算它是否大於r的概率,作為原假設,並使用分層排列測試進行檢驗。這種方法的優勢之處在於它考慮了樣本中的數據個數和在使用樣本計算等級相關係數的風險。
另外的一種方法是使用皮爾遜積矩中使用到的費雪變換。也就是,ρ的置信區間和零檢驗可以通過費雪變換獲得
如果F(r)是r的Fisher變換,則
r的z-值,其中,r在統計依賴(ρ=0)的零假設下近似服從標準正態分佈
顯著性為
其在零假設下近似服從自由度為n−2的t分佈
一般地,斯皮爾曼相關係數在有三個或更多條件的情況下是有用的。並且,它預測觀測數據有一個特定的順序。 例如,在同一任務中,一系列的個體會被嘗試多次,並預測在多次嘗試過程中,性能會得到提升。在這種情況下,對條件間趨勢的顯著性檢驗由E. B. Page發展了,並通常稱為給定序列下的Page趨勢測驗。 [3] 

spearman相關係數一致性分析

經典的一致性分析是一種統計方法,它給兩個標稱變量賦給一個分數。 通過這種方法, 兩個變量間的皮爾遜相關係數被最大化了。
有一種被稱為級別相關分析的等價方法, 它最大化了斯皮爾曼相關係數或肯德爾相關係數。 [4] 
參考資料
  • 1.    Fieller, E.C.; Hartley, H.O.; Pearson, E.S. (1957) Tests for rank correlation coefficients. I. Biometrika 44, pp. 470–481
  • 2.    Piantadosi, J.; Howlett, P.; Boland, J. (2007) "Matching the grade correlation coefficient using a copula with maximum disorder", Journal of Industrial and Management Optimization, 3 (2), 305–312
  • 3.    Maritz. J.S. (1981) Distribution-Free Statistical Methods, Chapman & Hall. ISBN 0-412-15940-6. (page 217)
  • 4.    Myers, Jerome L.; Well, Arnold D., Research Design and Statistical Analysis 2nd, Lawrence Erlbaum: 508, 2003, ISBN 0-8058-4037-0