複製鏈接
請複製以下鏈接發送給好友

非參數方法

鎖定
在一個統計推斷問題中,如果總體分佈的具體形式已知(最常見的是假定為正態分佈),則我們只需對其中含有的若干個未知參數作出估計或進行某種形式的假設檢驗,這類推斷方法稱為參數方法。但在許多實際問題中,我們對總體分佈的形式往往所知甚少(如只能作出諸如連續型分佈、關於均值對稱等微弱的假定),甚至一無所知。這時就需要使用不必(或很少)依賴於總體分佈形式的統計推斷方法,此類推斷方法通常稱為非參數方法(non-parametric method)。 [1] 
中文名
非參數方法
外文名
non-parametric method
別    名
非參數檢驗
所屬領域
數理統計學的一個分支
相對概念
參數方法
定    義
在假設檢驗中,如果檢驗統計量是不依賴於總體的分佈或參數(粗略地説,就是檢驗統計量中不包含總體的參數或總體參數的估計值)的

非參數方法定義

在假設檢驗中,如果檢驗統計量是不依賴於總體的分佈或參數(粗略地説,就是檢驗統計量中不包含總體的參數或總體參數的估計值)的,則這種檢驗方法就稱為非參數方法非參數檢驗。與此對應的假設檢驗方法就可稱為參數方法參數檢驗
非參數方法應用範圍廣,計算簡便,適合處理小樣本資料。但是,非參數方法與參數方法相比,靈敏性和精確度較差。非參數方法發展迅速,新的方法不斷出現,這裏只介紹幾種簡單常用的方法,旨在使讀者對非參數方法有個概括的瞭解。 [2] 

非參數方法克魯斯卡爾一沃利斯單向方差秩檢驗

克魯斯卡爾一沃利斯單向方差秩檢驗的應用很廣泛,它只要求樣本是獨立的,即使總體不服從正態分佈或方差不等,仍可運用於多個總體是否相同的假設檢驗。該方法採用的是秩而不是原始觀察數據,將各個樣本的數據合在一起,並按從小到大的順序排列起來,每個數據的序號就是它的秩。檢驗的一般步驟如下:
(1) 先將各樣本的觀察值按大小順序排列,找出它們相應的秩,最小觀察值的秩定為1,最大觀察值的秩為n,這裏n為各樣本容量的總和。
(2) 耦合中的每一個觀察值用彼此耦合的各觀察值的平均秩來代替。例如,有三個觀察值相同,相應的應該為4,5,6,在這場合下,我們用秩的平均數5(即
)分別作為這三個觀察值的秩。
(3) 計算如下統計量
式中
——樣本數;
——第j個樣本中觀察值的數目;
——第j個樣本中的秩和。
(4) 如果H很大,我們就傾向於懷疑原假設:“
個樣本來自同分布的總體。”當觀察值只有3組,而且每組中觀察值的數目不多於5個時,可以利用“克一沃”檢驗統計量的臨界值表確定統計量H的顯著性。
(5) 當k>3或
>5時,(1)式的統計量近似於服從自由度為(k一1)的
分佈,因此,這時可將H計算值同給定的顯著水平下自由度為(k一1)的
表中的數值相比較。 [2] 

非參數方法遊程檢驗

非參數方法遊程的概念

遊程檢驗可以用來檢驗一個樣本是否具有隨機性,也可用來檢驗兩個總體是否具有相同的分佈。
例如,有下列一組人員前來申請參加某項工作的訓練,其次序按照男女性別排列。第一組前來申請的男女次序如下(序列一):
女女女女 男男男男 女女女女 男男男男
以上樣本中男女申請者的總人數雖然是相同的,但其出現的次序並非隨機的。如果是隨機出現,男性出現與女性出現應該互相摻合,不可能按照某種規則排列,所以並非是隨機樣本。
假如前來申請的人員中.其男女次序如下列所示(序列二):
女男女男女男女男女男女男女男女男
很顯然,這個樣本也是非隨機的。
遊程是指一個樣本中每個連續出現的某觀察值的區段,每個區段包含的樣本觀察值的個數稱為遊程長度。例如,以上序列一中有4個遊程,長度分別為4,其中女性為2個遊程,其長度分別為4,4;男性為2個遊程,其長度也分別為4,4。
通常用
表示序列中第一種類型出現的次數;
表示序列中第二種類型出現的次數;
表示遊程的個數。
上例序列一中,
上例序列二中,
遊程檢驗又稱連貫性檢驗,應用很廣泛,在生產、銷售、財務,以及質量控制問題中均可應用。例如,在生產過程中,技術人員想要了解在產品生產線上是否有系列的次品出現,如採用遊程檢驗只要隨機抽取少量的產品樣本進行檢驗就可分析產品質量。如有系統性而非偶然性的因素導致質量變動,即可及時採取措施加以預防,因而可以大大地節省費用,提高產品質量。

非參數方法遊程檢驗方法

現舉例説明一個樣本是否具有隨機性的遊程檢驗方法。
對於大樣本來説(樣本容量
均大於20),遊程個數
的分佈近似於正態分佈,其平均數和標準差分別為:
則可以按照正態分佈來進行檢驗,用下列公式計算Z值。
然後,設定顯著性水平
,將計算出的Z值同標準正態分佈的臨界值加以比較。若Z值大於等於上述臨界值,則不能接受原假設。若Z值介於正負臨界值之間,則接受原假設。 [2] 

非參數方法斯皮爾曼等級相關係數

斯皮爾曼等級相關係數,用
表示,顧名思義,應以等級所構成的數據算出。利用斯皮爾曼等級相關係數,可以檢驗:
(1)
相互獨立。
不相互獨立。
(2)
相互獨立。
的大值傾向於同
的大值相配對,即
存在正相關。
(3)
相互獨立。
的大值傾向於同
的小值相配對,即
存在負相關。
第一種假設是雙邊檢驗,後兩種假設為單邊檢驗。檢驗步驟如下:
(1) 抽取由等級構成的數據。如原始數據的形式不是等級數據,那就要按大小排成等級。
(2) 待分析數據由容量為n的雙變量隨機樣本組成。其中一個變量用X表示,設其等級為
(X的最小觀察值),
(X的最大觀察值)。另一個變量用Y表示,設其觀察值按由小到大的順序排成的等級為:
,每一組
代表相應一對變量。
(3) 如兩種等級完全正相關,則對所有的
,應有
;如兩種等級完全負相關,則對所有的
,應有
(4) 計算差距
,表示這些配對等級對完全正相關或完全負相關的偏離程度的量度。
(5) 計算統計量
(6) 統計判斷。可以證明,統計量
的取值範圍在-1到+1之間。如
完全正相關,則
;如
完全負相關,則
。當兩個等級的相關程度弱於完全相關時,
將處於+1與一1之間。檢驗
顯著性的方法與樣本容量有關。如n≤30,可查斯皮爾曼檢驗統計量的臨界值表,該表載有與每種
值相對應的
的臨界值。如n>30,則可計算統計量
然後將它同給定的顯著性水平
標準正態分佈的相應的臨界值相比較,以確定其顯著性。 [2] 
參考資料
  • 1.    王學民.統計分析方法及應用:上海財經大學出版社,2010.06
  • 2.    鄭德如.統計學(第3版):立信會計出版社,2011.12