-
經驗法則
(統計學原理)
鎖定
在統計學中,經驗法則是在正態分佈中,距平均值小於一個標準差、二個標準差、三個標準差以內的百分比,更精確的數字是68.27%、95.45%及99.73%。
經驗法則最常在統計中用於預測最後結果。在得到數據的標準差,並在可以收集確切的數據之前,該規則可作為一個對即將到來的數據結果的粗略估計。該概率特別適用於一些需要消耗大量時間去收集的數據,甚至是不可能獲得的數據。
- 中文名
- 經驗法則
- 所屬學科
- 統計學
- 表達式
- 68-95-99.7
用數學用語表示,其算式如下,其中X為正態分佈隨機變數的觀測值,μ為分佈的平均值,而σ為標準差:
在實驗科學中有對應正態分佈的三西格馬定律(three-sigma rule of thumb),是一個簡單的推論,內容是“幾乎所有”的值都在平均值正負三個標準差的範圍內,也就是在實驗上可以將99.7%的幾率視為“幾乎一定”
[1]
。不過上述推論是否有效,會視探討領域中“顯著”的定義而定,在不同領域,“顯著”的定義也隨着不同,例如在社會科學中,若置信區間是在正負二個標準差(95%)的範圍,即可視為顯著。但是在粒子物理中,若是發現新的粒子,置信區間要到正負五個標準差(99.99994%)的程度。
在不是正態分佈的情形下,也有另一個對應的三西格馬定律,即使是在非正態分佈的情形下,至少會有88.8%的幾率會在正負三個標準差的範圍內,這是依照切比雪夫不等式的結果。若是單模分佈(unimodal distributions)下,正負三個標準差內的幾率至少有95%,若一些符合特定條件的分佈,幾率至少會到98%。
[2]
由於正態分佈含有指數項的特性,超出某個標準差範圍的概率會隨着該範圍的擴大而大幅減小。假如某實驗每天進行一次,則實驗結果超出某標準差範圍的頻率可列為下表:
範圍 | 預期的樣本比例在範圍內 | 近似預期頻率超出範圍 | 近似頻率(假設每天實驗一次) |
---|---|---|---|
μ±0.5σ | 0.382924922548026 | 3次中發生2次 | 每星期四至五次 |
μ±σ | 0.682689492137086 | 3次中發生1次 | 每星期兩次 |
μ±1.5σ | 0.866385597462284 | 7次中發生1次 | 每星期 |
μ±2σ | 0.954499736103642 | 22次中發生1次 | 每三個星期 |
μ±2.5σ | 0.987580669348448 | 81次中發生1次 | 每三個月 |
μ±3σ | 0.99730020393674 | 370次中發生1次 | 每年 |
μ±3.5σ | 0.999534741841929 | 2149次中發生1次 | 每六年 |
μ±4σ | 0.999936657516334 | 15787次中發生1次 | 每43年(約一生兩次) |
μ±4.5σ | 0.999993204653751 | 147160次中發生1次 | 每403年(世界近代以來僅1次) |
μ±5σ | 0.999999426696856 | 1744278次中發生1次 | 每4776年(人類歷史有記錄以來僅1次) |
μ±5.5σ | 0.999999962020875 | 26330254次中發生1次 | 每72090年(智人出現以來僅4次) |
μ±6σ | 0.999999998026825 | 506797346次中發生1次 | 每138萬年(直立人出現以來僅1-2次) |
μ±6.5σ | 0.99999999991968 | 12450197393次中發生1次 | 每3400萬年(恐龍滅絕以來僅2次) |
μ±7σ | 0.99999999999744 | 390682215445次中發生1次 | 每10.7億年(地球形成以來僅4次) |
μ±xσ | 每 |
- 詞條統計
-
- 瀏覽次數:次
- 編輯次數:2次歷史版本
- 最近更新: Music_Space501