-
樣本方差
鎖定
均值是指在一組數據中所有數據之和再除以數據的個數。
- 中文名
- 樣本方差
- 外文名
- sample Variance
- 學 科
- 概率論
- 表 示
- 一列數的變異程度
- 應 用
- 人口差異的統計
- 相關名詞
- 樣本均值
樣本方差公式
樣本方差簡介
在許多實際情況下,人口的真實差異事先是不知道的,必須以某種方式計算。 當處理非常大的人口時,不可能對人口中的每個物體進行計數,因此必須對人口樣本進行計算。樣本方差也可以應用於從該分佈的樣本的連續分佈的方差的估計。
[2-3]
樣本方差無偏性
我們從一個樣本取n個值y1,...,yn,其中n 偏差的平均值:
[4]
這裏,
表示樣本均值。
由於
是隨機選擇的,所以
和
是隨機變量。 他們的預期值可以通過從羣體中的大小為n的所有可能樣本
的集合進行平均來評估。 對於
,有
因此
給出了基於因子
的人口方差的估計值。
被稱為偏樣本方差。 糾正該偏差之後形成無偏樣本方差:
估計值可以簡單地稱為樣本方差。 同樣的證明也適用於從連續概率分佈中抽取的樣本。
n-1的使用稱為貝塞爾校正(Bessel's correction),也用於樣本協方差和樣本標準偏差(方差平方根)。 平方根是一個凹函數,因此引入負偏差(由Jensen不等式),這取決於分佈,因此校正樣本標準偏差(使用貝塞爾校正)有偏差。 標準偏差的無偏估計是技術上的問題,對於使用術語n-1.5的正態分佈,形成無偏估計。
無偏樣本方差是函數ƒ(y1,y2)=(y1-y2)2/2的U統計量,這意味着它是通過對羣體的兩個樣本統計平均得到的。
樣本方差分佈
作為隨機變量的函數,樣本方差本身就是一個隨機變量,研究其分佈是很自然的。 在yi是來自正態分佈的獨立觀察的情況下,Cochran定理表明s2服從卡方分佈:
所以可求;
和
如果yi獨立同分布,但不一定是正態分佈,那麼
如果大數定律的條件對於平方觀測值同樣適用,則s2是σ2的一致估計量。 可以看出,估計的方差趨於零。 在Kenney and Keeping(1951:164),Rose和Smith(2002:264)和Weisstein(n.d.)中給出了漸近等效的公式。