複製鏈接
請複製以下鏈接發送給好友

非參數檢驗

鎖定
非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。非參數檢驗是在總體方差未知或知道甚少的情況下,利用樣本數據對總體分佈形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分佈的參數,因而得名為“非參數”檢驗。
中文名
非參數檢驗
外文名
Nonparametrictests
應用學科
心理學
應用範圍
實驗心理學
非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。參數檢驗是在總體分佈形式已知的情況下,對總體分佈的參數如均值方差等進行推斷的方法。但是,在數據分析過程中,由於種種原因,人們往往無法對總體分佈形態作簡單假定,此時參數檢驗的方法就不再適用了。非參數檢驗正是一類基於這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分佈形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分佈的參數,因而得名為“非參數”檢驗。

非參數檢驗非參數檢驗

SPSS單樣本非參數檢驗是對單個總體的分佈形態等進行推斷的方法,其中包括卡方檢驗、二項分佈檢驗、K-S檢驗以及變量值隨機性檢驗等方法。
總體分佈的卡方檢驗
例如,醫學家在研究心臟病人猝死人數與日期的關係時發現:一週之中,星期一心臟病人猝死者較多,其他日子則基本相當。當天的比例近似為2.8:1:1:1:1:1:1。現收集到心臟病人死亡日期的樣本數據,推斷其總體分佈是否與上述理論分佈相吻合。
卡方檢驗方法可以根據樣本數據,推斷總體分佈與期望分佈或某一理論分佈是否存在顯著差異,是一種吻合性檢驗,通常適於對有多項分類值的總體分佈的分析。它的原假設是:樣本來自的總體分佈與期望分佈或某一理論分佈無差異。
二項分佈檢驗
在生活中有很多數據的取值是二值的,例如,人羣可以分成男性和女性,產品可以分成合格和不合格,學生可以分成三好學生和非三好學生,投擲硬幣實驗的結果可以分成出現正面和出現反面等。通常將這樣的二值分別用1或0表示。如果進行n次相同的實驗,則出現兩類(1或0)的次數可以用離散型隨機變量X來描述。如果隨機變量X為1的概率設為P,則隨機變量X值為0的概率Q便等於1-P,形成二項分佈。
SPSS的二項分佈檢驗正是要通過樣本數據檢驗樣本來自的總體是否服從指定的概率為P的二項分佈,其原假設是:樣本來自的總體與指定的二項分佈無顯著差異。
從某產品中隨機抽取23個樣品進行檢測並得到檢測結果。用1表示一級品,用0表示非一級品。根據抽樣結果驗證該批產品的一級品率是否為90%。
單樣本K-S檢驗
K-S檢驗方法能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分佈,是一種擬合優度的檢驗方法,適用於探索連續型隨機變量的分佈。
例如,收集一批週歲兒童身高的數據,需利用樣本數據推斷週歲兒童總體的身高是否服從正態分佈。再例如,利用收集的住房狀況調查的樣本數據,分析家庭人均住房面積是否服從正態分佈。
單樣本K-S檢驗的原假設是:樣本來自的總體與指定的理論分佈無顯著差異,SPSS的理論分佈主要包括正態分佈、均勻分佈、指數分佈泊松分佈等。
變量值隨機性檢驗
變量值隨機性檢驗通過對樣本變量值的分析,實現對總體的變量值出現是否隨機進行檢驗。
例如,在投硬幣時,如果以1表示出現的是正面,以0表示出現的是反面,在進行了若干次投幣後,將會得到一個以1,0組成的變量值序列。這時可能會分析“硬幣出現正反面是否是隨機的”這樣的問題。
變量值隨機性檢驗正是解決這類問題的一個有效方法。它的原假設是:總體變量值出現是隨機的。
變量隨機性檢驗的重要依據是遊程。所謂遊程是樣本序列中連續出現相同的變量值的次數。可以直接理解,如果硬幣的正反面出現是隨機的,那麼在數據序列中,許多個1或許多個0連續出現的可能性將不太大,同時,1和0頻繁交叉出現的可能性也會較小。因此,遊程數太大或太小都將表明變量值存在不隨機的現象。
例:為檢驗某耐壓設備在某段時間內工作是否持續正常,測試並記錄下該時間段內各個時間點上的設備耐壓的數據。現採用遊程檢驗方法對這批數據進行分析。如果耐壓數據的變動是隨機的,可認為該設備工作一直正常,否則認為該設備有不能正常工作的現象。

非參數檢驗檢驗方法

兩獨立樣本的非參數檢驗
兩獨立樣本的非參數檢驗是在對總體分佈不甚瞭解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自的兩個總體的分佈等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。
SPSS中提供了多種兩獨立樣本的非參數檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W遊程檢驗、極端反應檢驗等。
某工廠用甲乙兩種不同的工藝生產同一種產品。如果希望檢驗兩種工藝下產品的使用是否存在顯著差異,可從兩種工藝生產出的產品中隨機抽樣,得到各自的使用壽命數據。
甲工藝:675 682 692 679 669 661 693
乙工藝:662 649 672 663 650 651 646 652
曼-惠特尼U檢驗
兩獨立樣本的曼-惠特尼U檢驗可用於對兩總體分佈的比例判斷。其原假設:兩組獨立樣本來自的兩總體分佈無顯著差異。曼-惠特尼U檢驗通過對兩組樣本平均秩的研究來實現判斷。秩簡單説就是變量值排序的名次,可以將數據按升序排列,每個變量值都會有一個在整個變量值序列中的位置或名次,這個位置或名次就是變量值的秩。
K-S檢驗
K-S檢驗不僅能夠檢驗單個總體是否服從某一理論分佈,還能夠檢驗兩總體分佈是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分佈無顯著差異。
這裏是以變量值的秩作為分析對象,而非變量值本身。
遊程檢驗
單樣本遊程檢驗是用來檢驗變量值的出現是否隨機,而兩獨立變量的遊程檢驗則是用來檢驗兩獨立樣本來自的兩總體的分佈是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分佈無顯著差異。
兩獨立樣本的遊程檢驗與單樣本遊程檢驗的思想基本相同,不同的是計算遊程數的方法。兩獨立樣本的遊程檢驗中,遊程數依賴於變量的秩。
極端反應檢驗
極端反應檢驗從另一個角度檢驗兩獨立樣本所來自的兩總體分佈是否存在顯著差異。其原假設是:兩獨立樣本來自的兩總體的分佈無顯著差異。
基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對於控制樣本是否出現了極端反應。如果實驗樣本沒有出現極端反應,則認為兩總體分佈無顯著差異,相反則認為存在顯著差異。
多獨立樣本的非參數檢驗
多獨立樣本的非參數檢驗是通過分析多組獨立樣本數據,推斷樣本來自的多個總體的中位數或分佈是否存在顯著差異。多組獨立樣本是指按獨立抽樣方式獲得的多組樣本。
SPSS提供的多獨立樣本非參數檢驗的方法主要包括中位數檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗。
例:希望對北京、上海、成都、廣州四個城市的週歲兒童的身高進行比較分析。採用獨立抽樣方式獲得四組獨立樣本。
中位數檢驗
中位數檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的中位數無顯著差異。
基本思想是:如果多個總體的中位數無顯著差異,或者説多個總體有共同的中位數,那麼這個共同的中位數應在各樣本組中均處在中間位置上。於是,每組樣本中大於該中位數或小於該中位數的樣本數目應大致相同。
Kruskal-Wallis檢驗
Kruskal-Wallis檢驗實質是兩獨立樣本的曼-惠特尼U檢驗在多個樣本下的推廣,也用於檢驗多個總體的分佈是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的分佈無顯著差異。
基本思想是:首先,將多組樣本數據混合並按升序排序,求出各變量值的秩;然後,考察各組秩的均值是否存在顯著差異。容易理解:如果各組秩的均值不存在顯著差異,則是多組數據充分混合,數值相差不大的結果,可以認為多個總體的分佈無顯著差異;反之,如果各組秩的均值存在顯著差異,則是多組數據無法混合,某些組的數值普遍偏大,另一些組的數值普遍偏小的結果,可以認為多個總體的分佈有顯著差異。
Jonckheere-Terpstra檢驗
Jonckheere-Terpstra檢驗也是用於檢驗多個獨立樣本來自的多個總體的分佈是否存在顯著差異的非參數檢驗方法,其原假設是:多個獨立樣本來自的多個總體的分佈無顯著差異。
基本思想與兩獨立樣本的曼-惠特尼U檢驗類似,也是計算一組樣本的觀察值小於其他組樣本的觀察值的個數。
兩配對樣本的非參數檢驗
兩配對樣本的非參數檢驗是對總體分佈不甚瞭解的情況下,通過對兩組配對樣本的分析,推斷樣本來自的兩個總體的分佈是否存在顯著差異的方法。
SPSS提供的兩配對樣本非參數檢驗的方法主要包括McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗等。
例:要檢驗一種新的訓練方法是否對提高跳遠運動員的成績有顯著效果,可以收集一批跳遠運動員在使用新訓練方法前後的跳遠最好成績,這樣的兩組樣本便是配對的。再例如,分析不同廣告形式是否對商品的銷售產生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數據(其他條件保持基本穩定)。這裏不同廣告形式下的若干組商品銷售額樣本便是配對樣本。可見,配對樣本的樣本數是相同的,且各樣本值的先後次序是不能隨意更改的。
McNemar檢驗
是一種變化顯著性檢驗,它將研究對象自身作為對照者檢驗其“前後”的變化是否顯著。其原假設是:兩配對樣本來自的兩總體的分佈無顯著差異。
分析學生在學習“統計學”課程前後對統計學重要性的認知程度是否發生了顯著改變,可以隨機收集一批學生在學習“統計學”之前以及學完以後認為統計學是否重要的樣本數據(0表示“不重要”,1表示“重要”)。
應該看到:兩配對樣本的McNemar檢驗分析的變量是二值變量。因此,在實際應用中,如果變量不是二值變量,應首先進行數據轉換後方可採用該方法,因而它在應用範圍方面有一定的侷限性。
符號檢驗
符號檢驗也是用來檢驗兩配對樣本所來自的總體的分佈是否存在顯著差異的非參數方法。其原假設是:兩配對樣本來自的兩總體的分佈無顯著差異。
首先,分別用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,差值為負則記為負號。然後,將正號的個數與負號的個數進行比較,容易理解:如果正號個數和負號個數大致相當,則可以認為第二組樣本大於第一組樣本變量值的個數,與第二組樣本小於第一組樣本的變量值個數是大致相當的,從總體上講,這兩個組配對樣本的數據分佈差距較小;相反,如果正號個數和負號個數相差較多,則可以認為兩個配對樣本的數據分佈差距較大。
應該看到:配對樣本的符號檢驗注重對變化方向的分析,只考慮數據變化的性質,即是變大了還是變小了,但沒有考慮變化幅度,即大了多少,小了多少,因而對數據利用是不充分的。
Wilcoxon符號秩檢驗
Wilcoxon符號秩檢驗也是通過分析兩配對樣本,對樣本來自的兩總體的分佈是否存在差異進行判斷。其原假設是:兩配對樣本來自的兩總體的分佈無顯著差異。
基本思想是:首先,按照符號檢驗的方法,分佈用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,為負則記為負號,並同時保存差值數據;然後,將差值變量按升序排序,並求出差值變量的秩;最後,分佈計算正號秩總和W+和負號秩和W-。
多配對樣本的非參數檢驗
多配對樣本的非參數檢驗是通過分析多組配對樣本數據,推斷樣本來自的多個總體的中位數或分佈是否存在顯著差異。
例如,收集乘客對多家航空公司是否滿意的數據,分析航空公司的服務水平是否存在顯著差異;再例如,收集不同促銷形式下若干種商品的銷售額數據,分析比較不同促銷形式的效果,再如,收集多名評委對同一批歌手比賽打分的數據,分析評委的打分標準是否一致,等等。
這些問題都可以通過多配對樣本非參數檢驗方法進行分析。SPSS中的多配對樣本的非參數檢驗方法主要包括Friedman檢驗、Cochran Q檢驗、Kendall協同係數檢驗等。
Friedman檢驗
Friedman檢驗是利用秩實現對多個總體分佈是否存在顯著差異的非參數檢驗方法,其原假設是:多個配對樣本來自的多個總體分佈無顯著差異。
SPSS將自動計算Friedman統計量和對應的概率P值。如果概率P值小於給定的顯著性水平0.05,則拒絕原假設,認為各組樣本的秩存在顯著差異,多個配對樣本來自的多個總體的分佈有顯著差異;反之,則不能拒絕原假設,可以認為各組樣本的秩不存在顯著性差異
基於上述基本思路,多配對樣本的Friedman檢驗時,首先以行為單位將數據按升序排序,並求得各變量值在各自行中的秩;然後,分別計算各組樣本下的秩總和與平均秩。多配對樣本的Friedman檢驗適於對定距型數據的分析。
Cochran Q檢驗
通過對多個配對樣本的分析,推斷樣本來自的多個總體的分佈是否存在顯著差異。其原假設是:多個配對樣本來自的多個總體的分佈無顯著差異。
Cochran Q檢驗適合對二值品質型數據的分析。如二分的評價:1代表滿意,0代表不滿意。
Kendall協同係數檢驗
它也是一種對多配對樣本進行檢驗的非參數檢驗方法,與第一種檢驗方法向結合,可方便地實現對評判者的評判標準是否一致的分析。其原假設是:評判者的評判標準不一致。
有6名歌手參加比賽,4名評委進行評判打分,現在需要根據數據推斷這4個評委的評判標準是否一致。(見下頁具體分析)
如果將每個被評判者對象的分數看做來自多個總體的配對樣本,那麼該問題就能夠轉化為多配對樣本的非參數檢驗問題,仍可採用Friedman檢驗,於是相應的原假設便轉化為:多個配對樣本來自的多個總體的分佈無顯著差異。但對該問題的分析是需要繼續延伸的,並非站在對6名歌手的演唱水平是否存在顯著差異的角度進行分析,而是在認定他們存在差異的前提下繼續判斷4個評委的打分標準是否一致。
如果利用Friedman檢驗出各總體的分佈不存在顯著差異,即各個歌手的秩不存在顯著差異,則意味着評委的打分存在隨意性,評分標準不一致。原因在於:如果各個評委的評判標準是一致的,那麼對於某個歌手來説將獲得一致的分數,也就是説,評委給出的若干個評分的秩應完全相同,這就必然會導致各歌手評分的秩有較大的差異。 [1] 
參考資料
  • 1.    孟慶茂,常建華 編著.實驗心理學:北京師範大學出版社,1999