複製鏈接
請複製以下鏈接發送給好友

卡方分佈

鎖定
若n個相互獨立的隨機變量ξ₁,ξ₂,...,ξn ,均服從標準正態分佈(也稱獨立同分佈於標準正態分佈),則這n個服從標準正態分佈的隨機變量的平方和構成一新的隨機變量,其分佈規律稱為卡方分佈(chi-square distribution)。卡方分佈是一種常見的概率分佈。 [3] 
中文名
卡方分佈
外文名
chi-square distribution
別    名
西格瑪分佈
表達式
{ \chi _{k}^{2}\!}
提出者
Friedrich Robert Helmert
提出時間
1863年
應用學科
統計學

目錄

卡方分佈簡介

分佈在數理統計中具有重要意義。
分佈是由阿貝(Abbe)於1863年首先提出的,後來由海爾墨特(Hermert)和現代統計學的奠基人之一的卡·皮爾遜(C K.Pearson)分別於1875年和1900年推導出來,是統計學中的一個非常有用的著名分佈。 [1] 

卡方分佈定義

卡方分佈 卡方分佈
若n個相互獨立的隨機變量ξ₁、ξ₂、……、ξn ,均服從標準正態分佈(也稱獨立同分佈於標準正態分佈),則這n個服從標準正態分佈的隨機變量的平方和
構成一新的隨機變量,其分佈規律稱為
分佈(chi-square distribution),其中參數 n=v,稱為自由度,正如正態分佈中均數方差不同就是另一個正態分佈一樣,自由度不同就是另一個
分佈。記為
或者
(其中
為限制條件數)。
卡方分佈是由正態分佈構造而成的一個新的分佈,當自由度
很大時,
分佈近似為正態分佈。
對於任意正整數x自由度
卡方分佈是一個隨機變量X的機率分佈。 [2] 

卡方分佈性質

1.
分佈在第一象限內,卡方值都是正值,呈正偏態(右偏態),隨着參數
的增大,
分佈趨近於正態分佈;卡方分佈密度曲線下的面積都是1.
2.
分佈的均值與方差可以看出,隨着自由度
的增大,χ2分佈向正無窮方向延伸(因為均值
越來越大),分佈曲線也越來越低闊(因為方差
越來越大)。
3.不同的自由度決定不同的卡方分佈,自由度越小,分佈越偏斜。
4. 若
互相獨立,則:
服從
分佈,自由度為
5.
分佈的均數為自由度
,記為
6.
分佈的方差為2倍的自由度(
),記為 D(
) =

卡方分佈概率表

卡方分佈臨界值表 卡方分佈臨界值表
分佈不像正態分佈那樣將所有正態分佈的查表都轉化為標準正態分佈去查,在
分佈中得對每個分佈編制相應的概率值,這通過
分佈表中列出不同的自由度來表示,在
分佈表中還需要如標準正態分佈表中給出不同 P 值一樣,列出概率值,只不過這裏的概率值是
值以上
分佈曲線以下的概率。由於
分佈概率表中要列出很多
分佈的概率值,所以
分佈中所給出的 P 值就不像標準正態分佈中那樣給出了400個不同的 P 值,而只給出了有代表性的13個值,因此
分佈概率表的精度就更差,不過給出了常用的幾個值,足夠在實際中使用了。
分佈概率表時,按自由度及相應的概率去找到對應的
值。如圖《卡方分佈臨界值表》所示的單側概率
0.05(7)=14.1的查表方法就是,在第一列找到自由度7這一行,在第一行中找到概率0.05這一列,行列的交叉處即是14.1。
表中所給值直接只能查單側概率值,可以變化一下來查雙側概率值。例如,要在自由度為7的卡方分佈中,得到雙側概率為0.05所對應的上下端點可以這樣來考慮:雙側概率指的是在上端和下端各劃出概率相等的一部分,兩概率之和為給定的概率值,這裏是0.05,因此實際上上端點以上的概率為0.05/2=0.025,用概率0.025查表得上端點的值為16,記為
0.05/2(7)=16。下端點以下的概率也為0.025,因此可以用0.975查得下端點為1.69,記為
1-0.05/2(7)=1.69。
當然也可以按自由度及
值去查對應的概率值,不過這往往只能得到一個大概的結果,因為
分佈概率表的精度有限,只給了 13 個不同的概率值進行查表。例如,要在自由度為 18 的
分佈查找
=30 對應的概率,則先在第一列找到自由度 18,然後看這一行可以發現與 30 接近的有28.9與31.5,它們所在的列是0.05與0.025,所以要查的概率值應於介於0.05與0.025之間,當然這是單側概率值,它們的雙側概率值界於0.1與0.05之間。如果要更精確一些可以採用插值的方法得到,這在正態分佈的查表中有介紹。
為什麼從正態總體中抽取出的樣本的方差服從
分佈
抽樣分佈理論一節裏講到,從正態總體進行一次抽樣就相當於獨立同分布的 n 個正態隨機變量ξ1,ξ2,…,ξn的一次取值,將 n 個隨機變量針對總體均值方差進行標準化得(i=1,…,n),顯然每個都是服從標準正態分佈的,因此按照
分佈的定義,應該服從參數為
分佈。
如果將總體中的方差σ2樣本方差 s2代替,它是否也服從
分佈呢?理論上可以證明,它是服從
分佈的,但是參數
不是 n 而是 n-1 了,究其原因在於它是 n-1 個獨立同分布於標準正態分佈的隨機變量的平方和
我們常常把一個式子中獨立變量的個數稱為這個式子的“自由度”,確定一個式子自由度的方法是:若式子包含有 n 個變量,其中k 個被限制的樣本統計量,則這個表達式的自由度為 n-k。比如中包含ξ1,ξ2,…,ξn這 n 個變量,其中ξ1-ξn-1相互獨立,ξn為其餘變量的平均值,因此自由度為 n-1。
參考資料
  • 1.    汪忠志主編;範愛華,張敬和,張永進,胡萍,胡姿嵐,吳紹鳳編寫組.概率論與數理統計教程 第2版:中國科學技術大學出版社,2014.08
  • 2.    武愛文,馮衞國,衞淑芝等編.概率論與數理統計:上海交通大學出版社,2011
  • 3.    查嶺生,李俊,丁建華.卡方分佈的Excel構建與模擬[J].淮北師範大學學報:自然科學版,2020,41(3):92-96