反饋

t檢驗

t檢驗，亦稱student t檢驗（Student's t test），主要用於樣本含量較小（例如n < 30），總體標準差σ未知的正態分佈。^[1] t檢驗是用t分佈理論來推論差異發生的概率，從而比較兩個平均數的差異是否顯著。它與f檢驗、卡方檢驗並列。t檢驗是戈斯特為了觀測釀酒質量而發明的,並於1908年在Biometrika上公佈^[2] 。

中文名: t檢驗
外文名: Student's t test
別名: student t檢驗
提出者: 戈斯特

學科領域: 統計學
應用對象: 樣本量較小σ未知的正態分佈資料
主要應用: 比較兩個平均數的差異是否顯著
見載刊物: 《數學名詞》科學出版社
公佈時間: 1993年^[7]

t檢驗適用條件

(1) 已知一個總體均數；

(2) 可得到一個樣本均數及該樣本標準差；

(3) 樣本來自正態或近似正態總體^[3] 。

t檢驗主要分類

t檢驗可分為單總體檢驗和雙總體檢驗，以及配對樣本檢驗^[1] 。

t檢驗單總體檢驗

單總體t檢驗是檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著。當總體分佈是正態分佈，如總體標準差未知且樣本容量小於30，那麼樣本平均數與總體平均數的離差統計量呈t分佈。

單總體t檢驗統計量為：

其中

為樣本平均數，

為樣本標準偏差，n為樣本數。該統計量t在零假説：μ=μ₀為真的條件下服從自由度為n的t分佈。

t檢驗雙總體檢驗

雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體t檢驗又分為兩種情況，一是獨立樣本t檢驗（各實驗處理組之間毫無相關存在，即為獨立樣本），該檢驗用於檢驗兩組非相關樣本被試所獲得的數據的差異性；一是配對樣本t檢驗，用於檢驗匹配而成的兩組被試獲得的數據或同組被試在不同條件下所獲得的數據的差異性，這兩種情況組成的樣本即為相關樣本。

（1）獨立樣本t檢驗統計量為：

S₁²和 S₂²為兩樣本方差；n₁ 和n₂ 為兩樣本容量。

（2）配對樣本檢驗

配對樣本t檢驗可視為單樣本t檢驗的擴展，不過檢驗的對象由一羣來自常態分配獨立樣本更改為二羣配對樣本之觀測值之差。若二配對樣本x₁_i與x₂_i之差為d_i=x₁_i−x₂_i獨立，且來自常態分配，則d_i之母體期望值μ是否為μ₀可利用以下統計量：

其中

為配對樣本差值之平均數，

為配對樣本差值之標準偏差，n為配對樣本數。該統計量t在零假説：μ=μ₀為真的條件下服從自由度為n−1的t分佈。

t檢驗檢驗步驟

下面以一個實例的單總體t檢驗對t檢驗做一説明：^[4]

問題：難產兒出生數n = 35，體重均值

= 3.42，S = 0.40，一般嬰兒出生體

圖1t界值表

重 μ₀= 3.30（大規模調查獲得），問相同否？

解：

1.建立假設、確定檢驗水準α

H₀：μ = μ0 （零假設null hypothesis）

H₁：μ ≠ μ0（備擇假設alternative hypothesis）

雙側檢驗，檢驗水準：α=0.05

2.計算檢驗統計量

3.查相應界值表，確定P值，下結論。

查附表（圖1），t_{0.025 / 34}= 2.032, t < t_{0.025 / 34}, P >0.05，按α=0.05水準，不拒絕H0，兩者的差別無統計學意義。

t檢驗注意事項

1、選用的檢驗方法必須符合其適用條件(注意：t檢驗的前提：1.來自正態分佈總體； 2.隨機樣本；3.均數比較時，要求兩樣本總體方差相等，即具有方差齊性) ^[3] 。理論上，即使樣本量很小時，也可以進行t檢驗。（如樣本量為10，一些學者聲稱甚至更小的樣本也行），只要每組中變量呈正態分佈，兩組方差不會明顯不同。如上所述，可以通過觀察數據的分佈或進行正態性檢驗估計數據的正態假設。方差齊性的假設可進行F檢驗，或進行更有效的Levene's檢驗。如果不滿足這些條件，可以採用校正的t檢驗，或者換用非參數檢驗代替t檢驗進行兩組間均值的比較。

2、區分單側檢驗和雙側檢驗。單側檢驗的界值小於雙側檢驗的界值，因此更容易拒絕，犯第Ⅰ錯誤的可能性大^[3] 。t檢驗中的p值是接受兩均值存在差異這個假設可能犯錯的概率。在統計學上，當兩組觀察對象總體中的確不存在差別時，這個概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性，我們只要考慮單側概率分佈，將所得到t-檢驗的P值分為兩半。另一些學者則認為無論何種情況下都要報告標準的雙側t檢驗概率。

3、假設檢驗的結論不能絕對化^[3] 。當一個統計量的值落在臨界域內，這個統計量是統計上顯著的，這時拒絕虛擬假設。當一個統計量的值落在接受域中，這個檢驗是統計上不顯著的，這是不拒絕虛擬假設H₀。因為，其不顯著結果的原因有可能是樣本數量不夠拒絕H₀ ，有可能犯第Ⅰ類錯誤。

4、正確理解P值與差別有無統計學意義^[3] 。P越小，不是説明實際差別越大，而是説越有理由拒絕H₀ ，越有理由説明兩者有差異，差別有無統計學意義和有無專業上的實際意義並不完全相同。

5、假設檢驗和可信區間的關係結論具有一致性差異：提供的信息不同區間估計給出總體均值可能取值範圍，但不給出確切的概率值，假設檢驗可以給出H₀成立與否的概率^[3] 。

6、涉及多組間比較時，慎用t檢驗^[3] 。科研實踐中，經常需要進行兩組以上比較，或含有多個自變量並控制各個自變量單獨效應後的各組間的比較，（如性別、藥物類型與劑量），此時，需要用方差分析進行數據分析，方差分析被認為是t檢驗的推廣。在較為複雜的設計時，方差分析具有許多t-檢驗所不具備的優點。（進行多次的t檢驗進行比較設計中不同格子均值時）。

t檢驗實現平台

大多數的試算表軟件及統計軟件都可以進行t檢驗之運算，諸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python、PSPP、Minitab等^[5] 。

t檢驗實用場景

單樣本檢驗：檢驗一個正態分佈的總體的均值是否在滿足零假設的值之內^[6] 。
雙樣本檢驗：其零假設為兩個正態分佈的總體的均值是相同的。這一檢驗通常被稱為學生t檢驗。但更為嚴格地説，只有兩個總體的方差是相等的情況下，才稱為學生t檢驗；否則，有時被稱為Welch檢驗。以上談到的檢驗一般被稱作“未配對”或“獨立樣本”t檢驗，我們特別是在兩個被檢驗的樣本沒有重疊部分時用到這種檢驗方式^[6] 。
檢驗同一統計量的兩次測量值之間的差異是否為零。舉例來説，我們測量一位病人接受治療前和治療後的腫瘤尺寸大小。如果治療是有效的，我們可以推定多數病人接受治療後，腫瘤尺寸變小了。這種檢驗一般被稱作“配對”或者“重複測量”t檢驗。
檢驗一條迴歸線的斜率是否顯著不為零。

t檢驗實用舉例

t檢驗可用於比較男女身高是否存在差別

為了進行獨立樣本t檢驗，需要一個自（分組）變量（如性別：男、女）與一個因變量（如身高測量值）。根據自變量的特定值，比較各組中因變量的均值。用t檢驗比較下列男、女兒童身高的均值^[5] 。

1、假設

H₀：男平均身高 = 女平均身高

H₁：男平均身高 ≠ 女平均身高

選用雙側檢驗：選用α=0.05的統計顯著水平^[5] 。

2、SPSS中的數據的排列

被試者	性別	身高
對象1 對象2 對象3 對象4 對象5	男性男性男性女性女性	111 110 109 102 104
男性身高均數 = 110 ；女性身高均數 = 103

3、選擇SPSS中compare means菜單，獨立樣本， t-test。選擇雙側檢驗，以及統計顯著性水平α=0.05 運行^[5] 。

4、從輸出結果查看t檢驗的p值，是否達到顯著水平：是，接受H_1，男平均身高與女平均身高不同；否，接受H₀，尚無證據支持男女身高差異^[5] 。

參考資料

1. Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52.
2. 尹希果主編．計量經濟學原理與操作：重慶大學出版社，2009.09：37
3. 陳望忠主編．醫學中英文論文寫作與編輯：軍事醫學科學出版社，2007.7：159
4. O'Connor, John J.; Robertson, Edmund F., Gosset, MacTutor History of Mathematics archive
5. 劉江濤，劉立佳編著．SPSS數據統計與分析應用教程基礎篇：清華大學出版社，2017.01：61-65
6. 雷蕾著．應用語言學研究設計與統計：華中科技大學出版社，2016.03：57
7. t檢驗．911查詢[引用日期2021-07-06]

t檢驗的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：70次歷史版本
最近更新：爱豆在哪儿（2023-12-30）

1 適用條件
2 主要分類: 2.1 單總體檢驗; 2.2 雙總體檢驗
3 檢驗步驟
4 注意事項
5 實現平台
6 實用場景
7 實用舉例

t檢驗

目錄