複製鏈接
請複製以下鏈接發送給好友

抽樣分佈

鎖定
抽樣分佈也稱統計量分佈、隨機變量函數分佈,是指樣本估計量的分佈。樣本估計量是樣本的一個函數,在統計學中稱作統計量,因此抽樣分佈也是指統計量的分佈。以樣本平均數為例,它是總體平均數的一個估計量,如果按照相同的樣本容量,相同的抽樣方式,反覆地抽取樣本,每次可以計算一個平均數,所有可能樣本的平均數所形成的分佈,就是樣本平均數的抽樣分佈。
中文名
抽樣分佈
外文名
Sampling Distribution
學    科
統計學
目    的
統計量的分佈
特    點
抽樣分佈是統計推斷的理論基礎
又    名
隨機變量函數分佈

抽樣分佈類型

抽樣分佈單一樣本統計量

當我們要對某一總體的參數進行估計時,就要研究來自該總體的所有可能的樣本統計量的分佈問題,比如樣本均值的分佈、樣本比例的分佈,從而概括有關統計量抽樣分佈的一般規律。
(一)樣本均值的抽樣分佈
1.樣本均值抽樣分佈的形成
樣本均值的抽樣分佈即所有樣本均值的可能取值形成的概率分佈。例如,某高校大一年級參加英語四級考試的人數為6000人,為了研究這6000人的平均考分,欲從中隨機抽取500人組成樣本進行觀察。若逐一抽取全部可能樣本,並計算出每個樣本的平均考分,將會得出很多不完全相同的樣本均值,全部可能的樣本均值有一個相應的概率分佈,即為樣本均值的抽樣分佈。
我們知道,從總體的N個單位中抽取一個容量為n的隨機樣本,在重複抽樣條件下,共有
個可能的樣本;在不重複抽樣條件下,共有
個可能的樣本。因此,樣本均值是一個隨機變量。
2.樣本均值抽樣分佈的特徵
從抽樣分佈的角度看,我們所關心的分佈的特徵主要是數學期望和方差。這兩個特徵一方面與總體分佈的均值和方差有關,另一方面也與抽樣的方法是重複抽樣還是不重複抽樣有關。樣本均值的方差則與抽樣方法有關。在重複抽樣條件下,樣本均值的方差為總體方差的1/n,即:
公式一:
不重複抽樣條件下,樣本均值的方差為:
公式二:
從公式一和公式二可以看出兩者僅相差係數
,該係數通常被稱為有限總體修正係數。在實際應用中,這一系數常常被忽略不計,主要是因為:對於無限總體進行不重複抽樣時,由於N未知,此時樣本均值的標準差仍可按公式一計算,即可按重複抽樣處理;對於有限總體,當N很大而抽樣比例n/N很小時,其修正係數
,通常在樣本容量n小於總體容量N的5%時,有限總體修正係數就可以忽略不計。因此,公式一是計算樣本均值方差的常用公式。
3.樣本均值抽樣分佈的形式
樣本均值抽樣分佈的形式與原有總體的分佈和樣本容量n的大小有關。如果原有總體是正態分佈,那麼,無論樣本容量的大小,樣本均值的抽樣分佈都服從正態分佈。如果原有總體的分佈是非正態分佈,就要看樣本容量的大小。隨着樣本容量n的增大(通常要求n≥30),不論原來的總體是否服從正態分佈,樣本均值的抽樣分佈都將趨於正態分佈,即統計上著名的中心極限定理。雖然總體成績的分佈形態未知,但σ已知,且n=150為大樣本,依據中心極限定理可知:樣本均值的抽樣分佈近似服從正態分佈。
(二)樣本比例的抽樣分佈
樣本比例即指樣本中具有某種特徵的單位所佔的比例。樣本比例的抽樣分佈就是所有樣本比例的可能取值形成的概率分佈。例如,某高校大一年級學生參加英語四級考試的人數有6000人,為了估計這6000人中男生所佔的比例,從中抽取500人組成樣本進行觀察,若逐一抽取全部可能樣本,並計算出每個樣本的男生比例,則全部可能的樣本比例的概率分佈,即為樣本比例的抽樣分佈。可見,樣本比例也是一個隨機變量。
1.樣本比例抽樣分佈的特徵
在大樣本情況下,樣本比例的抽樣分佈特徵可概括如下:
無論是重複抽樣還是不重複抽樣,樣本比例p的數學期望總是等於總體比例P,即:
公式一:E(p)=P
而樣本比例p的方差,在重複抽樣條件下為:
公式二:
在不重複抽樣條件下為:
2.樣本比例抽樣分佈的形式
樣本比例的分佈屬於二項分佈問題,當樣本容量n足夠大時,即當nP與n(1一P)都不小於5時,樣本比例的抽樣分佈近似為正態分佈。

抽樣分佈兩個樣本統計量

如果要對兩個總體有關參數的差異進行估計,就要研究來自這兩個總體的所有可能樣本相應統計量差異的抽樣分佈。
若從總體X1和總體X2 中分別獨立地抽取容量為n1和n2的樣本,則由兩個樣本均值之差
的所有可能取值形成的概率分佈稱為兩個樣本均值差異的抽樣分佈。
設總體X1和總體X2的均值分別為μ1和μ2,標準差分別為σ1和σ2,則兩個樣本均值之差
的抽樣分佈可概括為以下兩種情況:
(1)若總體X1-
,總體X2-
,則
(2)若兩個總體都是非正態總體,當兩個樣本容量n1和n2都足夠大時,依據中心極限定理,
分別近似服從正態分佈,則

抽樣分佈定理

(1)從總體中隨機抽取容量為n的一切可能個樣本的平均數之平均數,等於總體的平均數,即
,(E為平均的符號,
為樣本的平均數,μ為總體的平均數)。
(2)從正態總體中,隨機抽取的容量為n的一切可能樣本平均數的分佈也呈正態分佈。
(3)雖然總體不是正態分佈,如果樣本容量較大,反映總體μ和σ的樣本平均數的抽樣分佈,也接近於正態分佈。

抽樣分佈正態總體的抽樣分佈

設X1,X2,...,Xn是來自正態總體
的樣本,
樣本均值,S2樣本方差。則有如下結論:
與S2獨立 [1] 

抽樣分佈其他分佈

統計中用隨機變量X的取值範圍及其取值概率的序列來描述這個隨機變量,稱之為隨機變量X的概率分佈。如果我們知道隨機變量X的取值範圍及其取值概率的序列,就可以用某種函數來表述X取值小於某個值的概率,即為分佈函數:F(X)=P(X≤z)。
例如,一個由N家工業企業組成的總體,X為銷售收入。將總體所有企業的銷售收入按大小順序排隊,累計出總體中銷售收入小於某值x的企業數量併除以總體企業總數N,就可得到總體中銷售收入小於x的企業的頻率,也即抽取一個銷售收入小於x的企業的概率。此頻率或概率隨着x值不同而變化形成一個序列,形成了銷售收入X的概率分佈。
總體分佈是在總體中X的取值範圍及其概率。
樣本分佈是在樣本中X的取值範圍及其概率。上例中,如果抽取n個企業作為樣本,我們同樣可以用這n個銷售收入的取值範圍及其概率描述其分佈,也即樣本分佈。樣本分佈也稱為經驗分佈,隨着樣本容量n的逐漸增大,樣本分佈逐漸接近總體分佈。
抽樣分佈是指樣本統計量的概率分佈。採用同樣的抽樣方法和同等的樣本量,從同一個總體中可以抽取出許許多多不同的樣本,每個樣本計算出的樣本統計量的值也是不同的。樣本統計量也是隨機變量,抽樣分佈則是樣本統計量的取值範圍及其概率。
研究概率分佈對於抽樣調查是十分重要的,因為只有知道概率分佈,才能夠利用抽樣技術推斷抽樣誤差。現實中,總體的分佈狀況通常是未知的,但我們也無需知道總體分佈,而只需知道抽樣分佈 [2] 
參考資料
  • 1.    盛驟, 謝式千, 潘承毅.概率論與數理統計(第三版).北京:高等教育出版社,2001:168
  • 2.    馬軍海.管理統計學:北京大學出版社,2011