反饋

假設檢驗

假設檢驗(hypothesis testing)，又稱統計假設檢驗，是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。顯著性檢驗是假設檢驗中最常用的一種方法，也是一種最基本的統計推斷形式，其基本原理是先對總體的特徵做出某種假設，然後通過抽樣研究的統計推理，對此假設應該被拒絕還是接受做出推斷。常用的假設檢驗方法有Z檢驗、t檢驗、卡方檢驗、F檢驗等^[1] 。

中文名: 假設檢驗
外文名: hypothesis test
提出者: K.Pearson

提出時間: 20世紀初
應用領域: 數理統計、通信
檢驗方法: t檢驗，Z檢驗，卡方檢驗，F檢驗等

假設檢驗基本思想

假設檢驗的基本思想是“小概率事件”原理，其統計推斷方法是帶有某種概率性質的反證法。小概率思想是指小概率事件在一次試驗中基本上不會發生。反證法思想是先提出檢驗假設，再用適當的統計方法，利用小概率原理，確定假設是否成立。即為了檢驗一個假設H₀是否正確，首先假定該假設H₀正確，然後根據樣本對假設H₀做出接受或拒絕的決策。如果樣本觀察值導致了“小概率事件”發生，就應拒絕假設H₀，否則應接受假設H₀^[1] 。

假設檢驗中所謂“小概率事件”，並非邏輯中的絕對矛盾，而是基於人們在實踐中廣泛採用的原則，即小概率事件在一次試驗中是幾乎不發生的，但概率小到什麼程度才能算作“小概率事件”，顯然，“小概率事件”的概率越小，否定原假設H₀就越有説服力，常記這個概率值為α(0<α<1)，稱為檢驗的顯著性水平。對於不同的問題，檢驗的顯著性水平α不一定相同，一般認為，事件發生的概率小於0.1、0.05或0.01等，即“小概率事件”^[1] 。

假設檢驗基本步驟

1、提出檢驗假設又稱無效假設，符號是H₀；備擇假設的符號是H₁^[2] 。

H₀：樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的^[2] ；

H₁：樣本與總體或樣本與樣本間存在本質差異^[2] ；

預先設定的檢驗水準為0.05；當檢驗假設為真，但被錯誤地拒絕的概率，記作α，通常取α=0.05或α=0.01^[2] 。

2、選定統計方法，由樣本觀察值按相應的公式計算出統計量的大小，如X₂值、t值等。根據資料的類型和特點，可分別選用Z檢驗，T檢驗，秩和檢驗和卡方檢驗等^[2] 。

3、根據統計量的大小及其分佈確定檢驗假設成立的可能性P的大小並判斷結果。若P>α，結論為按α所取水準不顯著，不拒絕H₀，即認為差別很可能是由於抽樣誤差造成的，在統計上不成立；如果P≤α，結論為按所取α水準顯著，拒絕H₀，接受H₁，則認為此差別不大可能僅由抽樣誤差所致，很可能是實驗因素不同造成的，故在統計上成立。P值的大小一般可通過查閲相應的界值表得到^[2] 。

4、注意問題

1、作假設檢驗之前，應注意資料本身是否有可比性^[2] 。

2、當差別有統計學意義時應注意這樣的差別在實際應用中有無意義^[2] 。

3、根據資料類型和特點選用正確的假設檢驗方法^[2] 。

4、根據專業及經驗確定是選用單側檢驗還是雙側檢驗^[2] 。

5、判斷結論時不能絕對化，應注意無論接受或拒絕檢驗假設，都有判斷錯誤的可能性^[2] 。

假設檢驗檢驗方法

u檢驗和t檢驗

t檢驗是英國統計學家Cosset在1908年以筆名“" student”發表的，因此亦稱 student t檢驗( Student' s t test)。t檢驗是用t分佈理論來推斷差異發生的概率，從而判定兩總體均數的差異是否有統計學意義，主要用於樣本含量較小(如n<60)，總體標準差σ未知，呈正態分佈的計量資料。若樣本含量較大(如n>60)，或樣本含量雖小，但總體標準差σ已知，則可採用u檢驗(亦稱：z檢驗)。但在統計軟件中，無論樣本量大小，均採用t檢驗進行統計分析^[3] 。

t檢驗和u檢驗的適用條件：①樣本來自正態總體或近似正態總體；②兩樣本總體方差相等，即具有方差齊性。在實際應用時，如與上述條件略有偏離，對結果亦不會有太大影響；③兩組樣本應相互獨立。根據比較對象的不同，t檢驗又分為單樣本t檢驗、配對t檢驗和兩獨立樣本t檢驗^[3] 。

F檢驗

採用F檢驗檢驗方差齊性，要求樣本均來自正態分佈的總體。檢驗統計量F等於兩樣本的較大方差

比較小方差

，其檢驗統計量公式為：^[4]

數理統計理論證明：當H₀（

）成立時，

服從F分佈。F分佈曲線的形狀由兩個參數

和

決定，F的取值範圍為0~∞^[4] 。

統計學家為應用的方便編制了的F分佈臨界值表，求得F值後，查F界值表得P值（F值愈大，P值愈小），然後按所取的α水準做出推斷結論^[4] 。

由於第一個樣本的方差既可能大於第二個樣本的方差，也可能小於第二個樣本的方差，故兩樣本方差比較的F檢驗是雙側檢驗^[4] 。

假設檢驗兩類錯誤

假設檢驗的基本思想是利用“小概率事件”原理做出統計判斷的，而“小概率事件”是否發生與一次抽樣所得的樣本及所選擇的顯著性水平α有關，由於樣本的隨機性及選擇顯著性水平α的不同，因此檢驗結果與真實情況也可能不吻合，從而假設檢驗是可能犯錯誤的^[1] 。

一般地，假設檢驗可能犯的錯誤有如下兩類^[1] ：

①當假設H₀正確時，小概率事件也有可能發生，此時我們會拒絕假設H₀。因而犯了“棄真”的錯誤，稱此為第一類錯誤，犯第一類錯誤的概率恰好就是“小概率事件”發生的概率α，即^[1]

P{拒絕H₀/H₀為真}=α

②當假設H₀不正確，但一次抽樣檢驗未發生不合理結果時，這時我們會接受H₀，因而犯了“取偽”的錯誤，稱此為第二類錯誤，記β為犯第二類錯誤的概率，即^[1]

P{接受H₀/H₀不真}=β

理論上，自然希望犯這兩類錯誤的概率都很小。當樣本容量n固定時，α、β不能同時都小，即α變小時，β就變大；而β變小時，α就變大。一般只有當樣本容量n增大時，才有可能使兩者變小。在實際應用中，一般原則是：控制犯第一類錯誤的概率，即給定α，然後通過增大樣本容量n來減小B。這種着重對第一類錯誤的概率α加以控制的假設檢驗稱為顯著性檢驗^[1] 。

假設檢驗應用

在雷達檢測中，目標是產生假設的源，它可使用兩個假設：H₁和H₀，分別表示目標存在(H₁)和不存在(H₀)。這是二元簡單假設檢驗。二元數字通信問題也是簡單假設檢驗。如果假設中含有目標未知參量，則是複合假設檢驗。m元通信問題也是複合假設檢驗。如果未知參量是隨機變化的，則是隨機參量信號的假設檢驗^[5] 。

通信系統和雷達系統常用的最佳準則，是最小錯誤概率準則，即最大後驗概率準則。以雷達檢測為例：目標是源，它可使用的兩個假設是H₁和H₀。接收端收到樣本X(雷達回波)後，判定H₁為真（目標存在），或判定H₀為真（目標不存在概率可分別表示為p(H₁/x)和p(H₀/x)，稱為後驗概率。最大後驗概率準則的判決規則是，若^[5]

則判定H₁為真(選擇H₁)；否則判定H₀為真^[5] 。

參考資料

1. 沈南山著,數學教育測量與統計分析,中國科學技術大學出版社,2017.01,第107頁~第108頁
2. 陸克斌，崔久波主編；萬志峯，董西紅，石麗，沈菊，鍾妙副主編；薛強主審,市場調查與預測,教育科學出版社,2013.08,第204頁
3. 吳學森主編,醫學統計學,中國醫藥科技出版社,2016.08,第40頁
4. 吳學森主編,醫學統計學,中國醫藥科技出版社,2016.08,第46頁
5. 欒正禧,中國郵電百科全書電信卷,人民郵電出版社,1993年09月第1版,第603頁

假設檢驗的概述圖（2張）

詞條統計

瀏覽次數：次
編輯次數：49次歷史版本
最近更新：番茄xiao白（2022-04-25）

1 基本思想
2 基本步驟
3 檢驗方法
4 兩類錯誤
5 應用