-
卡方分佈
鎖定
- 中文名
- 卡方分佈
- 外文名
- chi-square distribution
- 別 名
- 西格瑪分佈
- 表達式
- { \chi _{k}^{2}\!}
- 提出者
- Friedrich Robert Helmert
- 提出時間
- 1863年
- 應用學科
- 統計學
卡方分佈簡介
卡方分佈定義
若n個相互獨立的隨機變量ξ₁、ξ₂、……、ξn ,均服從標準正態分佈(也稱獨立同分佈於標準正態分佈),則這n個服從標準正態分佈的隨機變量的平方和
構成一新的隨機變量,其分佈規律稱為
分佈(chi-square distribution),其中參數 n=v,稱為自由度,正如正態分佈中均數或方差不同就是另一個正態分佈一樣,自由度不同就是另一個
分佈。記為
或者
(其中
,
為限制條件數)。
卡方分佈是由正態分佈構造而成的一個新的分佈,當自由度
很大時,
分佈近似為正態分佈。
卡方分佈性質
3.不同的自由度決定不同的卡方分佈,自由度越小,分佈越偏斜。
4. 若
互相獨立,則:
服從
分佈,自由度為
;
卡方分佈概率表
查
分佈概率表時,按自由度及相應的概率去找到對應的
值。如圖《卡方分佈臨界值表》所示的單側概率
0.05(7)=14.1的查表方法就是,在第一列找到自由度7這一行,在第一行中找到概率0.05這一列,行列的交叉處即是14.1。
表中所給值直接只能查單側概率值,可以變化一下來查雙側概率值。例如,要在自由度為7的卡方分佈中,得到雙側概率為0.05所對應的上下端點可以這樣來考慮:雙側概率指的是在上端和下端各劃出概率相等的一部分,兩概率之和為給定的概率值,這裏是0.05,因此實際上上端點以上的概率為0.05/2=0.025,用概率0.025查表得上端點的值為16,記為
0.05/2(7)=16。下端點以下的概率也為0.025,因此可以用0.975查得下端點為1.69,記為
1-0.05/2(7)=1.69。
當然也可以按自由度及
值去查對應的概率值,不過這往往只能得到一個大概的結果,因為
分佈概率表的精度有限,只給了 13 個不同的概率值進行查表。例如,要在自由度為 18 的
分佈查找
=30 對應的概率,則先在第一列找到自由度 18,然後看這一行可以發現與 30 接近的有28.9與31.5,它們所在的列是0.05與0.025,所以要查的概率值應於介於0.05與0.025之間,當然這是單側概率值,它們的雙側概率值界於0.1與0.05之間。如果要更精確一些可以採用插值的方法得到,這在正態分佈的查表中有介紹。
為什麼從正態總體中抽取出的樣本的方差服從
分佈
在抽樣分佈理論一節裏講到,從正態總體進行一次抽樣就相當於獨立同分布的 n 個正態隨機變量ξ1,ξ2,…,ξn的一次取值,將 n 個隨機變量針對總體均值與方差進行標準化得(i=1,…,n),顯然每個都是服從標準正態分佈的,因此按照
分佈的定義,應該服從參數為
的
分佈。
如果將總體中的方差σ2 用樣本方差 s2代替,它是否也服從
分佈呢?理論上可以證明,它是服從
分佈的,但是參數
不是 n 而是 n-1 了,究其原因在於它是 n-1 個獨立同分布於標準正態分佈的隨機變量的平方和