複製鏈接
請複製以下鏈接發送給好友

分層最佳抽樣

鎖定
分層最佳抽樣又稱“非比例抽樣”,是根據各層基本單位標準差的大小,來確定各層樣本數目的抽樣方法。
中文名
分層最佳抽樣
別    名
非比例抽樣
數據來源
各層基本單位標準差的大小
目    的
確定各層樣本數目的抽樣方法

目錄

分層最佳抽樣定義

在各層基本單位之間的差異過分懸殊、某些層的重要性大於其他層的情況下,採取非比例抽樣時,在這些層抽取的樣本數就多;反之,抽取的樣本數就少。如果採取同時兼顧層的大小和層內差異程度的大小來抽樣,則有利於提高綜合樣本對總體全貌的代表性,並可以提高樣本的可信程度。

分層最佳抽樣公式

採用分層最佳抽樣法,確定各樣本數目的計算公式如下:
式中:
N:第i層應抽出的樣本數目; N:樣本總數目; Ni:第i層的調查單位數; Si:第i層調查單位的樣本標準差 [1] 

分層最佳抽樣舉例

某地有居民20000户,其中高、中、低收入户分別為4000户、12000户、4000户。又已知高收入户的標準差為300元,中收入户的標準差為200元, 低收入户的標準差為100元。現要抽選200户做樣本,進行購買力的調查,用分層最佳抽樣法分配各層的樣本數目。
本題中,已知各層居民收入標準差,即:高收入層(n1)=300、中收入層(n2)=200、低收入層(n3)=100。為了便於計算,見列表:
各層次(不同經濟收入)
各層的調查單位數(户)Ni
各層的樣本標準差(元)Si
乘積NiSi
4000
12000
4000
300
200
100
1200000
2400000
400000
-
20000
-
4000000
按公式計算,各層的樣本數目為:
高收入層樣本數目:(户)
中收入層樣本數目:(户)
低收入層樣本數目:(户)
應用分層最佳抽樣方法計算出的各層樣本抽取數同分層比例抽樣法抽出的樣本數相比較,可以看出,因各層標準差大小不同,家庭收入高的分層樣本增加了20個(從40個變為60個),家庭收入中等的分層樣本數,仍然為120個,而家庭收入低的分層樣本數減少了20個(從40個變為20個)。高收入户和低收入户在調查總體中單位數都是4000户,為什麼從高收入户中產生樣本數目是60户,從低收入户中產生樣本數目只有20户。這是因為,高收入户的標準差大(300元),從中抽取樣本數目就要多一些。低收入户的標準差小(100元),從中抽取的樣本數可以少一些。這樣抽選到的綜合樣本比原先僅考慮分層比例抽樣得的綜合樣本更具有對調查總體的代表性,其抽樣調查推斷的總體結果準確性程度會有所提。
從理論上説,各層中的標準差估計值,反映的是各層的單位特徵值和各層平均值之間的差異。如果某層中各單位特徵值比較接近,差異較小,那麼從理論上説,標準差就小。因此,少抽取一些數目的樣本,仍然可以代表、反映該層的大致情況。如果某層內各單位差異較大,那麼標準差就較大,因而要適當多選一些樣本才更合理。
參考資料
  • 1.    沈南山. 數學教育測量與統計分析[M]. 2017.95