複製鏈接
請複製以下鏈接發送給好友

經驗法則

(統計學原理)

鎖定
經驗法則,又叫3-sigma法則或者68-95-99.7原則,用於對已知平均數標準差正態分佈數據進行快速推算。
統計學中,經驗法則是在正態分佈中,距平均值小於一個標準差、二個標準差、三個標準差以內的百分比,更精確的數字是68.27%、95.45%及99.73%。
經驗法則最常在統計中用於預測最後結果。在得到數據的標準差,並在可以收集確切的數據之前,該規則可作為一個對即將到來的數據結果的粗略估計。該概率特別適用於一些需要消耗大量時間去收集的數據,甚至是不可能獲得的數據。
中文名
經驗法則
所屬學科
統計學
表達式
68-95-99.7
用數學用語表示,其算式如下,其中X為正態分佈隨機變數的觀測值,μ為分佈的平均值,而σ為標準差:
x軸為標準分數,y軸是比標準分數接近平均值之內的比例 x軸為標準分數,y軸是比標準分數接近平均值之內的比例
在實驗科學中有對應正態分佈的三西格馬定律(three-sigma rule of thumb),是一個簡單的推論,內容是“幾乎所有”的值都在平均值正負三個標準差的範圍內,也就是在實驗上可以將99.7%的幾率視為“幾乎一定” [1]  。不過上述推論是否有效,會視探討領域中“顯著”的定義而定,在不同領域,“顯著”的定義也隨着不同,例如在社會科學中,若置信區間是在正負二個標準差(95%)的範圍,即可視為顯著。但是在粒子物理中,若是發現新的粒子,置信區間要到正負五個標準差(99.99994%)的程度。
在不是正態分佈的情形下,也有另一個對應的三西格馬定律,即使是在非正態分佈的情形下,至少會有88.8%的幾率會在正負三個標準差的範圍內,這是依照切比雪夫不等式的結果。若是單模分佈(unimodal distributions)下,正負三個標準差內的幾率至少有95%,若一些符合特定條件的分佈,幾率至少會到98%。 [2] 
由於正態分佈含有指數項的特性,超出某個標準差範圍的概率會隨着該範圍的擴大而大幅減小。假如某實驗每天進行一次,則實驗結果超出某標準差範圍的頻率可列為下表:
數值表
範圍
預期的樣本比例在範圍內
近似預期頻率超出範圍
近似頻率(假設每天實驗一次)
μ±0.5σ
0.382924922548026
3次中發生2次
每星期四至五次
μ±σ
0.682689492137086
3次中發生1次
每星期兩次
μ±1.5σ
0.866385597462284
7次中發生1次
每星期
μ±2σ
0.954499736103642
22次中發生1次
每三個星期
μ±2.5σ
0.987580669348448
81次中發生1次
每三個月
μ±3σ
0.99730020393674
370次中發生1次
每年
μ±3.5σ
0.999534741841929
2149次中發生1次
每六年
μ±4σ
0.999936657516334
15787次中發生1次
每43年(約一生兩次)
μ±4.5σ
0.999993204653751
147160次中發生1次
每403年(世界近代以來僅1次)
μ±5σ
0.999999426696856
1744278次中發生1次
每4776年(人類歷史有記錄以來僅1次)
μ±5.5σ
0.999999962020875
26330254次中發生1次
每72090年(智人出現以來僅4次)
μ±6σ
0.999999998026825
506797346次中發生1次
每138萬年(直立人出現以來僅1-2次)
μ±6.5σ
0.99999999991968
12450197393次中發生1次
每3400萬年(恐龍滅絕以來僅2次)
μ±7σ
0.99999999999744
390682215445次中發生1次
每10.7億年(地球形成以來僅4次)
μ±xσ
參考資料
  • 1.    Grafarend, Erik W. Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. 2006:553.
  • 2.    Friedrich Pukelsheim. The Three Sigma Rule. 2012, 48(2):88-91.