反饋

經驗法則

（統計學原理）

鎖定

經驗法則，又叫3-sigma法則或者68-95-99.7原則，用於對已知平均數和標準差的正態分佈數據進行快速推算。

在統計學中，經驗法則是在正態分佈中，距平均值小於一個標準差、二個標準差、三個標準差以內的百分比，更精確的數字是68.27%、95.45%及99.73%。

經驗法則最常在統計中用於預測最後結果。在得到數據的標準差，並在可以收集確切的數據之前，該規則可作為一個對即將到來的數據結果的粗略估計。該概率特別適用於一些需要消耗大量時間去收集的數據，甚至是不可能獲得的數據。

中文名: 經驗法則

所屬學科: 統計學
表達式: 68-95-99.7

用數學用語表示，其算式如下，其中X為正態分佈隨機變數的觀測值，μ為分佈的平均值，而σ為標準差：

x軸為標準分數，y軸是比標準分數接近平均值之內的比例

在實驗科學中有對應正態分佈的三西格馬定律（three-sigma rule of thumb），是一個簡單的推論，內容是“幾乎所有”的值都在平均值正負三個標準差的範圍內，也就是在實驗上可以將99.7%的幾率視為“幾乎一定”^[1] 。不過上述推論是否有效，會視探討領域中“顯著”的定義而定，在不同領域，“顯著”的定義也隨着不同，例如在社會科學中，若置信區間是在正負二個標準差（95%）的範圍，即可視為顯著。但是在粒子物理中，若是發現新的粒子，置信區間要到正負五個標準差（99.99994%）的程度。

在不是正態分佈的情形下，也有另一個對應的三西格馬定律，即使是在非正態分佈的情形下，至少會有88.8%的幾率會在正負三個標準差的範圍內，這是依照切比雪夫不等式的結果。若是單模分佈（unimodal distributions）下，正負三個標準差內的幾率至少有95%，若一些符合特定條件的分佈，幾率至少會到98%。^[2]

由於正態分佈含有指數項的特性，超出某個標準差範圍的概率會隨着該範圍的擴大而大幅減小。假如某實驗每天進行一次，則實驗結果超出某標準差範圍的頻率可列為下表：

數值表
範圍	預期的樣本比例在範圍內	近似預期頻率超出範圍	近似頻率（假設每天實驗一次）
μ±0.5σ	0.382924922548026	3次中發生2次	每星期四至五次
μ±σ	0.682689492137086	3次中發生1次	每星期兩次
μ±1.5σ	0.866385597462284	7次中發生1次	每星期
μ±2σ	0.954499736103642	22次中發生1次	每三個星期
μ±2.5σ	0.987580669348448	81次中發生1次	每三個月
μ±3σ	0.99730020393674	370次中發生1次	每年
μ±3.5σ	0.999534741841929	2149次中發生1次	每六年
μ±4σ	0.999936657516334	15787次中發生1次	每43年（約一生兩次）
μ±4.5σ	0.999993204653751	147160次中發生1次	每403年（世界近代以來僅1次）
μ±5σ	0.999999426696856	1744278次中發生1次	每4776年（人類歷史有記錄以來僅1次）
μ±5.5σ	0.999999962020875	26330254次中發生1次	每72090年（智人出現以來僅4次）
μ±6σ	0.999999998026825	506797346次中發生1次	每138萬年（直立人出現以來僅1-2次）
μ±6.5σ	0.99999999991968	12450197393次中發生1次	每3400萬年（恐龍滅絕以來僅2次）
μ±7σ	0.99999999999744	390682215445次中發生1次	每10.7億年（地球形成以來僅4次）
μ±xσ			每天

參考資料

1. Grafarend, Erik W. Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. 2006:553.
2. Friedrich Pukelsheim. The Three Sigma Rule. 2012, 48(2):88-91.

詞條統計

瀏覽次數：次
編輯次數：2次歷史版本
最近更新： Music_Space501 （2021-01-03）