複製鏈接
請複製以下鏈接發送給好友

秩和檢驗

鎖定
在實踐中我們常常會遇到以下一些資料,如需比較患者和正常人的血清鐵蛋白、血鉛值、不同藥物的溶解時間、實驗鼠發癌後的生存日數、護理效果評分等,我們將非參數統計中一種常用的檢驗方法--秩和檢驗,其中“秩”又稱等級、即上述次序號的和稱“秩和”,秩和檢驗就是用秩和作為統計量進行假設檢驗的方法。
中文名
秩和檢驗
外文名
rank sum test
作    用
作為統計量進行假設檢驗
配    對
對比較的資料應採用符號秩和檢驗
成    組
兩樣本成組資料的比較
多    樣
多個樣本比較
等    級
秩次的平均值作為其秩次

目錄

  1. 1 定義
  2. 2 背景
  3. 3 特點
  1. 4 類型
  2. 配對
  3. 成組
  1. 多樣
  2. 等級

秩和檢驗定義

秩和檢驗(rank sum test)又稱順序和檢驗,它是一種非參數檢驗(nonparametric test)。它不依賴於總體分佈的具體形式,應用時可以不考慮被研究對象為何種分佈以及分佈是否已知,因而實用性較強 [1] 

秩和檢驗背景

在總體分佈任意的情形下,檢驗配對的試驗數據所在總體的分佈位置有無顯著差異,往往可以利用符號檢驗的方法實現。但是符號檢驗只考慮差數的正負號,而不考慮差數的絕對值差異,會導致部分試驗信息損失,結果較為粗略。為了避免符號檢驗方法的這一缺陷,Wilcoxon提出了一種改進方法,稱為Wilcoxon秩和檢驗(rank sum test)。這種方法同時考慮了差異的方向和差異的大小,較之符號檢驗更為有效。而對於成組的試驗數據所在總體的分佈位置有無差異,也可以採用類似的方法進行檢驗。
秩和檢驗是通過將所有觀察值(或每對觀察值差的絕對值)按照從小到大的次序排列,每一觀察值(或每對觀察值差的絕對值)按照次序編號,稱為秩(或秩次)。對兩組觀察值(配對設計下根據觀察值差的正負分為兩組)分別計算秩和進行檢驗。除了比較各對數據差的符號外,這種方法還進一步比較了各對數據差值大小的秩次高低,因此其檢驗效率較符號檢驗為高 [2] 

秩和檢驗特點

多個樣本兩兩比較的秩和檢驗
同樣的,多個樣本組比較的秩和檢驗,如拒絕H0,只説明比較各組的總體分佈位置不同或不全相同,應在此基礎上進行兩兩比較,常用Nemenyi法。
秩和檢驗的優缺點
秩和檢驗的優點是(1)不受總體分佈限制,適用面廣;(2)適用於等級資料及兩端無確定值的資料;(3)易於理解,易於計算。缺點是符合參數檢驗的資料,用秩和檢驗,則不能充分利用信息,檢驗功效低。
3.應用中的注意事項:
(1)注意應用條件;
(2)編秩時相同值要取平均秩次;
(3)相同秩次較多時,統計量要校正。
秩和檢驗常用軟件
spss軟件,只要輸入數據,選擇合適的參數,就可以很快得到結果。

秩和檢驗類型

秩和檢驗配對

對配對比較的資料應採用符號秩和檢驗(signed-rank test),其基本思想是:若檢驗假設成立,則差值的總體分佈應是對稱的,故正負秩和相差不應懸殊。檢驗的基本步驟為:
(1)建立假設;
H0:差值的總體中位數為0;
H1:差值的總體中位數不為0;檢驗水準為0.05。
(2)算出各對值的代數差;
(3)根據差值的絕對值大小編秩;
(4)將秩次冠以正負號,計算正、負秩和;
(5)用不為“0”的對子數n及T(任取T+或T-)查檢驗界值表得到P值作出判斷。
應注意的是當n>25時,可用正態近似法計算u值進行u檢驗,當相同秩次較多時u值需進行校正。

秩和檢驗成組

兩樣本成組資料的比較應用Wilcoxon秩和檢驗,其基本思想是:若檢驗假設成立,則兩組的秩和不應相差太大。其基本步驟是:
(1)建立假設;
H0:比較兩組的總體分佈相同;
H1:比較兩組的總體分佈位置不同;檢驗水準為0.05。
(2)兩組混合編秩;
(3)求樣本數最小組的秩和作為檢驗統計量T;
(4)以樣本含量較小組的個體數n1、兩組樣本含量之差n2-n1及T值查檢驗界值表;
(5)根據P值作出統計結論。
同樣應注意的是,當樣本含量較大時,應用正態近似法作u檢驗;當相同秩次較多時,應用校正公式計算u值。

秩和檢驗多樣

多個樣本比較的秩和檢驗可用Kruskal-Wallis法,其基本步驟為:
(1)建立假設;
H0:比較各組總體分佈相同;
H1:比較各組總體分佈位置不同或不全相同;檢驗水準為0.05。
(2)多組混合編秩;
(3)計算各組秩和Ri;
(4)利用Ri計算出檢驗統計量H;
(5)查H界值表或利用卡方值確定概率大小。
應注意的是當相同秩次較多時,應計算校正Hc

秩和檢驗等級

這類資料的特點是無原始值,只知其所在組段,故應用該組段秩次的平均值作為其秩次,在此基礎上計算秩和並進行假設檢驗,其步驟與兩組或多組比較秩和檢驗相同。需注意的是由於樣本含量較多,相同秩次也較多,應用校正後的u值和H值。
參考資料
  • 1.    王呼生,常沛.《新編醫學計算機信息應用》.北京:中國鐵道出版社,2016.07
  • 2.    孟憲勇,王晶,劉彭.《生物統計學》.北京:海洋出版社 ,2016.09