反饋

非參數方法

在一個統計推斷問題中，如果總體分佈的具體形式已知(最常見的是假定為正態分佈)，則我們只需對其中含有的若干個未知參數作出估計或進行某種形式的假設檢驗，這類推斷方法稱為參數方法。但在許多實際問題中，我們對總體分佈的形式往往所知甚少(如只能作出諸如連續型分佈、關於均值對稱等微弱的假定)，甚至一無所知。這時就需要使用不必(或很少)依賴於總體分佈形式的統計推斷方法，此類推斷方法通常稱為非參數方法(non-parametric method)。^[1]

中文名: 非參數方法
外文名: non-parametric method
別名: 非參數檢驗
所屬領域: 數理統計學的一個分支

相對概念: 參數方法
定義: 在假設檢驗中，如果檢驗統計量是不依賴於總體的分佈或參數(粗略地説，就是檢驗統計量中不包含總體的參數或總體參數的估計值)的

非參數方法定義

在假設檢驗中，如果檢驗統計量是不依賴於總體的分佈或參數(粗略地説，就是檢驗統計量中不包含總體的參數或總體參數的估計值)的，則這種檢驗方法就稱為非參數方法或非參數檢驗。與此對應的假設檢驗方法就可稱為參數方法或參數檢驗。

非參數方法應用範圍廣，計算簡便，適合處理小樣本資料。但是，非參數方法與參數方法相比，靈敏性和精確度較差。非參數方法發展迅速，新的方法不斷出現，這裏只介紹幾種簡單常用的方法，旨在使讀者對非參數方法有個概括的瞭解。^[2]

非參數方法克魯斯卡爾一沃利斯單向方差秩檢驗

克魯斯卡爾一沃利斯單向方差秩檢驗的應用很廣泛，它只要求樣本是獨立的，即使總體不服從正態分佈或方差不等，仍可運用於多個總體是否相同的假設檢驗。該方法採用的是秩而不是原始觀察數據，將各個樣本的數據合在一起，並按從小到大的順序排列起來，每個數據的序號就是它的秩。檢驗的一般步驟如下：

(1) 先將各樣本的觀察值按大小順序排列，找出它們相應的秩，最小觀察值的秩定為1，最大觀察值的秩為n，這裏n為各樣本容量的總和。

(2) 耦合中的每一個觀察值用彼此耦合的各觀察值的平均秩來代替。例如，有三個觀察值相同，相應的秩應該為4，5，6，在這場合下，我們用秩的平均數5(即

)分別作為這三個觀察值的秩。

(3) 計算如下統計量

式中

——樣本數；

——第j個樣本中觀察值的數目；

——第j個樣本中的秩和。

(4) 如果H很大，我們就傾向於懷疑原假設：“

個樣本來自同分布的總體。”當觀察值只有3組，而且每組中觀察值的數目不多於5個時，可以利用“克一沃”檢驗統計量的臨界值表確定統計量H的顯著性。

(5) 當k>3或

>5時，(1)式的統計量近似於服從自由度為(k一1)的

分佈，因此，這時可將H計算值同給定的顯著水平下自由度為(k一1)的

表中的數值相比較。^[2]

非參數方法遊程檢驗

非參數方法遊程的概念

遊程檢驗可以用來檢驗一個樣本是否具有隨機性，也可用來檢驗兩個總體是否具有相同的分佈。

例如，有下列一組人員前來申請參加某項工作的訓練，其次序按照男女性別排列。第一組前來申請的男女次序如下(序列一)：

女女女女男男男男女女女女男男男男

以上樣本中男女申請者的總人數雖然是相同的，但其出現的次序並非隨機的。如果是隨機出現，男性出現與女性出現應該互相摻合，不可能按照某種規則排列，所以並非是隨機樣本。

假如前來申請的人員中．其男女次序如下列所示(序列二)：

女男女男女男女男女男女男女男女男

很顯然，這個樣本也是非隨機的。

遊程是指一個樣本中每個連續出現的某觀察值的區段，每個區段包含的樣本觀察值的個數稱為遊程長度。例如，以上序列一中有4個遊程，長度分別為4，其中女性為2個遊程，其長度分別為4，4；男性為2個遊程，其長度也分別為4，4。

通常用

表示序列中第一種類型出現的次數；

表示序列中第二種類型出現的次數；

表示遊程的個數。

上例序列一中，

。

上例序列二中，

。

遊程檢驗又稱連貫性檢驗，應用很廣泛，在生產、銷售、財務，以及質量控制問題中均可應用。例如，在生產過程中，技術人員想要了解在產品生產線上是否有系列的次品出現，如採用遊程檢驗只要隨機抽取少量的產品樣本進行檢驗就可分析產品質量。如有系統性而非偶然性的因素導致質量變動，即可及時採取措施加以預防，因而可以大大地節省費用，提高產品質量。