反饋

P值

P值是用來判定假設檢驗結果的一個參數，也可以根據不同的分佈使用分佈的拒絕域進行比較。由R·A·Fisher首先提出。

P值（P value）指當原假設為真時，比所得到的樣本觀察結果更極端的結果出現的概率。如果P值很小，説明原假設情況的發生的概率很小，而如果出現了，根據小概率原理，我們就有理由拒絕原假設，P值越小，我們拒絕原假設的理由越充分。總之，P值越小，表明結果越顯著。但是檢驗的結果究竟是“顯著的”、“中度顯著的”還是“高度顯著的”需要我們自己根據P值的大小和實際問題判定。

中文名: P值
外文名: P value

計算方法: 3種情況
作用: 用來判定假設檢驗結果的一個參數
創立者: R·A·Fisher

P值定義

P值是指在一個概率模型中，統計摘要（如兩組樣本均值差）與實際觀測數據相同，或甚至更大這一事件發生的概率。換言之，是檢驗假設零假設成立或表現更嚴重的可能性。P值若與選定顯著性水平（0.05或0.01）相比更小，則零假設會被否定而不可接受，然而這並不直接表明原假設正確。P值是一個服從正態分佈的隨機變量，在實際使用中因樣本等各種因素存在不確定性，產生的結果可能會帶來爭議。^[1]

P值意義

P value

P值發展史

R·A·Fisher（1890-1962）作為一代假設檢驗理論的創立者，在假設檢驗中首先提出P值的概念。他認為假設檢驗是一種程序，研究人員依照這一程序可以對某一總體參數形成一種判斷。也就是説，他認為假設檢驗是數據分析的一種形式，是人們在研究中加入的主觀信息。當時這一觀點遭到了Neyman-Pearson的反對，他們認為假設檢驗是一種方法，決策者在不確定的條件下進行運作，利用這一方法可以在兩種可能中作出明確的選擇，而同時又要控制錯誤發生的概率，這兩種方法進行長期且痛苦的論戰。雖然Fisher的這一觀點同樣也遭到了現代統計學家的反對，但是他對現代假設檢驗的發展作出了巨大的貢獻。

Fisher的具體做法是：

假定某一參數的取值；

選擇一個檢驗統計量(例如z 或Z 統計量) ，該統計量的分佈在假定的參數取值為真時應該是完全已知的；

從研究總體中抽取一個隨機樣本計算檢驗統計量的值計算概率P值（或者觀測）的顯著水平，即在假設為真時的前提下，檢驗統計量大於或等於實際觀測值的概率^[2] ；

若P<0.01，説明是較強的判定結果，拒絕假定的參數取值；若0.01<P<0.05，説明較弱的判定結果，拒絕假定的參數取值；若P>0.05，説明結果更傾向於接受假定的參數取值。

可是，那個年代，由於硬件的問題，計算P值並非易事，人們就採用了統計量檢驗方法，也就是我們最初學的t值和t臨界值比較的方法。統計檢驗法是在檢驗之前確定顯著性水平α，也就是説事先確定了拒絕域。但是，如果選中相同的

，所有檢驗結論的可靠性都一樣，無法給出觀測數據與原假設之間不一致程度的精確度量，即：只要統計量落在拒絕域，假設的結果都是一樣，即結果顯著。但實際上，統計量落在拒絕域不同的地方，實際上的顯著性有較大的差異。因此，隨着計算機的發展，P值的計算不再是個難題，成為最常用的統計指標之一。

P值計算方法

為理解P值的計算過程，用Z表示檢驗的統計量，ZC表示根據樣本數據計算得到的檢驗統計量值^[3] 。

左側檢驗

P值是當

時，檢驗統計量小於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率，即P值

右側檢驗

P值是當

時，檢驗統計量大於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率，即P值

雙側檢驗

P值是當

時，檢驗統計量大於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率，即P值

參考資料

1. Wasserstein, Ronald L.; Lazar, Nicole A. The ASA's Statement on p-Values: Context, Process, and Purpose. The American Statistician. 7 March 2016, 70 (2): 129–133 [30 October 2016]. doi:10.1080/00031305.2016.1154108
2. 趙桂梅. 統計假設檢驗p-值修正方法研究[D]. 北京理工大學, 2014.
3. 曾平. 問:統計學裏如何選擇檢驗水準(何時選擇P〈0.01或選擇P〈0.05為差異有統計學意義)?[J]. 中國心血管雜誌, 2011(1):25-25.

P值的概述圖（2張）

詞條統計

瀏覽次數：次
編輯次數：30次歷史版本
最近更新： chlin04 （2023-11-10）

1 定義
2 意義
3 發展史
4 計算方法

P值

目錄

P值定義

P值意義

P值發展史

P值計算方法