-
總體分佈
鎖定
當試驗次數無限增大時,試驗結果的頻率值就成為相應的概率,除了抽樣造成的誤差,精確地反映了總體取值的概率分佈規律,這種整體取值的概率分佈規律通常稱為總體分佈。
- 中文名
- 總體分佈
- 外文名
- populationdistribution
- 所屬領域
- 概率論
- 相關概念
- 參數估計、非參數估計、總體等
總體分佈基本概念
例如,研究一批燈泡的壽命,則整批燈泡的壽命組成的集合就是總體,每一個燈泡的壽命就是一個個體。又如,研究某班學生的高等數學期末考試成績時,該班全體學生的考試分數就是總體,其中每個學生的考試成績就是該總體中的個體。
在數理統計中,我們經常研究的是總體中各個個體的一項或幾項數量指標和該指標在總體中的分佈情況。用X表示數量指標,則指標值X隨個體不同而變化。由於在統計問題中,從總體中抽取個體是隨機抽取的,因此,X是一個隨機變量,這樣,從數學意義來説,總體可以作為隨機變量X所有可能取值的全體,個體就是其中的一個具體值,因而隨機變量X的分佈就完全描述了總體中所研究的數量指標的分佈情況,我們把總體與數量指標X可能取值的全體所組成的集合等同起來,用隨機變量X表示,總體的分佈就是指隨機變量X的分佈。
總體X作為一個隨機變量有一維與多維,連續型與離散型之分,而作為一個集合,則區分為有限總體與無限總體.
例如,某工廠一季度生產的電子元件壽命所構成的總體中,個體的總數就是一季度生產的電子元件數,這就是一個有限總體,而該工廠生產的所有電子元件的壽命所構成的總體是一個無限總體,在實際問題中,當有限總體所包含的個體的總數很大時,可以認為它是無限總體。
[1]
總體分佈檢驗
檢驗時,若總體分佈的形式是已知的,只是要對分佈中一些未知參數做檢驗.就是參數檢驗。但是,有時情況並非如此,在有些問題中,總體服從什麼分佈是未知的,我們的任務,就是要對總體是否服從某個分佈做檢驗.這樣的檢驗稱為總體分佈的檢驗。它是一種非參數檢驗。
含未知參數的總體分佈的檢驗
有一種非參數估計方法,即用頻率直方圖來估計總體
的分佈.它的做法是:作分點
,將
的取值範同[a,b]分成r個區間.設共進行了n次試驗,落在區間
中的樣本觀測值的個數為
為頻率,在每一個區間
上,以
為高度,作長方形,這樣得到由一排長方形構成的頻率直方圖。
設
是總體
落在區間
中的概率,由於樣本落在區間
中的頻率≈總體落在因司
中的概率,所以,有
。
現在的問題是要檢驗總體
是否服從某個已知的分佈
,一方面,可以從
的樣本求出
;另一方面,可以從
求出
,如果
服從
,則有
,即有
;如果
不服從
,則
與
的差別就會很大,正是從這一思想出發,產生了下列檢驗一個總體是否服從某個已知分佈的一種檢驗方法。
問題 設
是總體
的樣本落在區間
中的頻數(k=1,2,…,r),要檢驗
,其中,
是某個已知的不含未知參數的分佈。
檢驗方法
從
求出
,可以證明,若
為真,則當
的樣本觀測次數
時,有
因此可得到檢驗方法如下:對於給定的顯著水平
,自由度r-1,查表可得
分佈的臨界值
,使得
,從樣本求出
的值.當
時拒絕
;否則接受
。
注意:
(1)查
分佈表求臨界值時,在自由度k=r-1與
相交處查得
;
(2)為了保證檢驗結果比較可靠,最好有n≥50,nk≥5(k=1,2,…,r),如果有一些nk<5,可將相鄰的區間合併成一個區間;
含有未知參數的總體分佈的檢驗
問題 設nk是總體
的樣本落在區間
中的頻數(k=1,2,…,r),要檢驗
,這裏,
是某個形式已知的分佈,其中含有m個未知參數
。
檢驗方法
求出
的極大似然估計
,用它們代入
,計算總體
落在各個區間
中的概率的估計值
可以證明,若
為真,則當
的樣本觀測次數
時,有
若
不真,則
的值會偏大,統計量
的分佈,相對於
分佈來説,峯值位置會有一個向右的偏移。