複製鏈接
請複製以下鏈接發送給好友

多階段抽樣

鎖定
多階段抽樣(Multistage sampling):是指將抽樣過程分階段進行,每個階段使用的抽樣方法往往不同,即將各種抽樣方法結合使用,其在大型流行病學調查中常用。
多階段抽樣是先將一個很大的總體劃分為若干個子總體,即一階單位,再把一階單位劃分為若干個更小的單位,稱為二階單位,照此繼續下去劃分出更小的單位,依次稱為三階單位、四階單位等。然後分別按隨機原則逐階段抽樣。 [1] 
中文名
多階段抽樣
外文名
Multistage sampling
別    名
多級抽樣或分段抽樣
所屬領域
數理統計
定    義
將抽樣過程分階段進行
應用舉例
大型流行病學調查

多階段抽樣定義

多階段抽樣(Multistage sampling):是指將抽樣過程分階段進行,每個階段使用的抽樣方法往往不同,即將各種抽樣方法結合使用,其在大型流行病學調查中常用。其實施過程為,先從總體中抽取範圍較大的單元,稱為一級抽樣單元,再從每個抽得的一級單元中抽取範圍更小的二級單元,依此類推,最後抽取其中範圍更小的單元作為調查單位。
多階段抽樣(multistage sampling).也稱為多級抽樣或分段抽樣,指在抽取樣本的時候,按照抽樣個體的隸屬關係或層次關係,分為兩個或兩個以上的階段從總體中抽取樣本的一種抽樣方式。其具體操作過程是:第一階段.將總體劃分為若干個一級抽樣單位。從中抽選若干個一級抽樣單位入樣;第二階段,將入樣的每個一級單位分成若干個二級抽樣單位,從入樣的每個一級單位中抽選若干個二級抽樣單位入樣。從集體抽樣到個體抽樣,分成若干階段逐步地進行。在社會研究中,當總體的規模特別大,或者總體分佈的範圍特別廣時,研究者一般採取多階段抽樣的方法來抽取樣本。
比如,為了調查某縣人口的抽樣,可以分為三段進行,首先以鄉為抽樣框,抽取一部分,然後在抽中的鄉里面,以村為單位進行抽樣,即抽出若干個,最後,再在抽取的村裏面抽取一定的人口。整個過程中各階段的抽樣,則可以採取簡單隨機抽樣或者分層抽樣。
多階段抽樣區別於分層抽樣,也區別於整羣抽樣.適用於抽樣調查的面特別廣,不要求有具體的包括所有總體單位的抽樣框的情況.因而比較容易進行。它同樣適用於總體範圍太大,無法直接抽取樣本的情況。可以相對節省調查費用。因此在總體範圍特別大、對象的層次特別多的社會研究中一般採用多階段抽樣方法。但是由於每段抽樣都會有誤差,經過多階段抽樣,最後抽出來的樣本誤差就會比較大,這是多階段抽樣的主要缺點。另外,多階段抽樣時比較麻煩,從樣本對總體的估計比較複雜。在同等條件下可以通過增加開頭階段的樣本數適當減少最後階段的樣本數來儘量縮小誤差。 [2] 

多階段抽樣總目標

多階段抽樣的基本思路是將多階段總目標的抽樣精度分解為各階段目標量的抽樣精度,在總精度和各階段的精度之間建立一種有機的、量化的聯繫。
(1)可以解決特大總體的抽樣問題。當抽樣推斷的面很廣,沒有一個包括所有總體單位的抽樣框,或者總體範圍太大無法直接抽取樣本時,需要採用多階段抽樣。例如,全國農產量調查和城市居民的住户調查,樣本單位遍佈全國各地,顯然不可能直接一次抽到所需要的樣本,只能分成幾個階段來逐級抽取。
(2)可以相對地節約人力物力。從一個比較大的總體,抽取一個隨機樣本,勢必使抽到的樣本單位比較分散,若要派人調查,人力和物力的支出比較大。例如,一個縣要確定一些農户作樣本,用一次隨機抽樣的樣本很可能分佈在全縣各個鄉,調查往返的路費就比較大。如果分階段進行,先抽鄉,然後在抽中的鄉再抽若干户,這樣可以使樣本相對比較集中,因而可以節省人力和物力。
(3)可以利用現成的行政區劃、組織系統作為劃分各階段的依據,為組織抽樣調查提供方便。根據我國政治、經濟、管理的特點,各級黨政領導都需要統計數字,因而全國抽樣調查的數字往往不能滿足各級需要。如果能把多階段抽樣和各地需要結合起來,如各階段根據需要再適當地補充樣本,把多階段抽樣和各地的需要結合起來從而解決這一矛盾。 [3] 

多階段抽樣過程

多階段抽樣具體操作過程是:
第一階段,將總體分為若干個一級抽樣單位,從中抽選若干個一級抽樣單位入樣;
第二階段,將入樣的每個一級單位分成若干個二級抽樣單位,從入樣的每個一級單位中各抽選若干個二級抽樣單位入樣……,依此類推,直到獲得最終樣本
如果我們面對的一階單元內總體基本單元數相當大,作全面的調查就會比較困難,或者一階單元內各二階單元可以給出相近的結果,作全面的調查又無必要。此時從費用和抽樣估計效率考慮,便可以從總體中隨機抽取一部分一階單元,然後再從被抽中的一階單元內,隨機抽取部分二階單元並對他們作全面調查,我們把這種抽樣技術稱為兩階抽樣。
如果在被抽中的二階單元中,再抽取部分三階單元組成樣本,並對抽中的三階單元進行全面的調查,這就是三階抽樣。類似地,可以定義四階抽樣或更高階的抽樣,通常將兩階以上的抽樣稱為多階段抽樣。
需要指出的是,多階段抽樣中,各階可以採用不同的抽樣方法,也可採用同一種抽樣方法,要視具體情況和要求而定。
在兩階抽樣中,總體各一階單元所包含的二階單元數,有相等和不相等的兩種情況。前者無論在樣本的抽取還是在指標的估算方面都相對比較簡單,然而在抽樣實踐中卻很少有這種情況的存在,但作為基本方法仍然有其實際意義;後種情況在抽樣和指標的估算方法上都較為複雜,然而在實際中普遍存在此種情況。

多階段抽樣區別差異

多階段抽樣區別於分層抽樣,也區別於整羣抽樣,其優點在於適用於抽樣調查的面特別廣,沒有一個包括所有總體單位抽樣框,或總體範圍太大,無法直接抽取樣本等情況,可以相對節省調查費用。其主要缺點是抽樣時較為麻煩,而且從樣本對總體的估計比較複雜。
將總體分為若干個一階單元,如果在每一個一階單元中,都隨機抽取部分二階單元,由這些二階單元中的總體基本單元組成的樣本,在抽樣的方式上,就相當於分層抽樣;如果在全部的一階單元中,只抽取了部分一階單元,並對抽中的一階單元中的所有的基本單元都做全面調查,這就是整羣抽樣。
因此,分層抽樣實際是第一階抽樣比為100%時的一種特殊的兩階抽樣;而整羣抽樣實際上是第二階抽樣比為100%時的一種特殊的兩階抽樣,故也稱單級整羣抽樣。令fi為抽樣比,即有:
當時,二階抽樣可視為分層抽樣,當時,二階抽樣可視為整層抽樣。
多階抽樣與分層抽樣的主要區別在於:
一、分層抽樣是對總體中的每個一級樣本羣體進行全面入樣,再對所有的樣本進行抽查;而兩階抽樣則把總體中所有的羣體視為一階單元,對這些一階單元進行抽樣,將抽出的樣本再次進行抽樣(兩次都不是進行全面的調查),產生兩級樣本,最後綜合估算出總的一級樣本指標。
二、整羣抽樣是對總體中抽取的每個樣本羣體所包含的基本單元進行全面調查;而兩階抽樣則把總體中所有的羣體視為一階單元,對每一個被抽中的一階單元所包含的二級單元(即基本單位),不是進行全面的調查,而是再進行一次抽樣調查(也稱抽子樣本)。即兩階抽樣,產生兩級樣本,最後綜合估算出總的一級樣本指標。至於在綜合估算的方式方法上,兩階抽樣與整羣抽樣也是極其相似的,只不過前者為就被抽一級單元的樣本指標進行綜合估算,後者為就被抽樣羣體單元的全體指標進行綜合估算。

多階段抽樣特徵

(一) 便於組織抽樣。
當總體單元數目很大,分佈很廣時,若採用簡單隨機抽樣,那麼,編制全體總體單元的抽樣框和現場實施隨機抽樣,都是相當困難的;如果採用等距抽樣,則須將全部總體單元進行有序排列並等距抽取,也是很困難的;若採用分層抽樣。則為提高抽樣估計效率,需掌握全部總體單元的有關資料,按照分層的原則進行分層,然後到各層中去抽樣,這一分層和大範圍抽樣的工作,是很繁重的;若採用單級整羣抽樣,也需掌握全部總體單元的有關資料,按分羣的原則分羣,並在抽中的羣內作全面調查,這一分羣和在羣內做全面調查的工作也是很龐大的。
例如,我國有一億八千萬農户,為做農村住户調查,如果按上述幾種方式進行抽樣,其工作量之大是難以想象的。
若採用多階段抽樣,就可避免上述抽樣技術中的麻煩。它可按現有的現有的行政區域或地理區域劃分為各階抽樣單元,從而簡化抽樣框的編制便於樣本單元的抽取使整個抽樣調查組織工作容易進行。多階段抽樣既保持了單級整羣抽樣的優點,又克服了他的缺點。
(二)抽樣方式靈活,有利於提高抽樣的估計效率。
多階段抽樣中,各階段可以採用同一種抽樣方法,也可以根據各階單元的分佈情況,採用不同的抽樣方法。同時,還可以根據各階單元分佈情況的不同,安排不同的抽樣比。
(三)多階段抽樣對基本調查單元的抽選不是一步到位的。
至少要經過兩步抽樣,這也是多階段抽樣與單階抽樣的區別所。
在。因此,多階段抽樣的隨機性體現在每一階單元的抽選上。而在各階段可以充分利用輔助信息來增加效率。但由於在現實中,各階單元大小相等的情形又幾乎是不存在,所以對於各階單元大小不等的多階段抽樣,如何保證每個基本單元都有相同的可能性被抽中,是一個較為複雜的問題,有待進一步探討。
(四)多階段抽樣實質上是分層抽樣整羣抽樣的有機結合。
以兩階段抽樣為例,從總體上所有一階單元中抽取一部分單元,相當於從總體所有羣中抽取部分羣的整羣抽樣;而在每個抽中的一階單元中分別抽取部分二階單元,就相當於分層抽樣。即先整羣,後分層。因此,二階抽樣從技術上看是整羣抽樣與分層抽樣的綜合。
(五)多階段抽樣在抽樣時並不需要二階或更低階單元的抽樣框
對於第一階抽樣,初級單元的抽樣框是必要的。在以後的各階抽樣中,僅僅需對那些已抽中的單元準備下一級單元的抽樣框。
(六)多階段抽樣還可用於“散料”的抽樣,即散料抽樣。
所謂“散料”,是指連續鬆散的、不易區分的個體或抽樣單元的材料。例如一堆煤,一車水泥等。對於散料,抽樣單元可以人為劃分,也可以取其自然的單位。進行散料抽樣時,一級單元是自然或人為劃分的分裝(例如一袋水泥),二級單元則是從分裝中抽取一定數量(如一千克)的份樣作調查。

多階段抽樣舉例分析

以某省糧食產量調查為例。可以按行政區域劃分層次,以省為總體,以縣為抽樣單位。步驟為:
(1)從全省所有縣級單位中,抽取部分縣作為第一階段抽取的樣本。
(2)從被抽中縣的所有鄉或村中,抽取部分鄉或村作為第二階段抽取的樣本。
(3)從被抽中鄉或村的所有農户中,抽取部分農户作為第三階段抽取的樣本。
(4)從被抽中農户的所有播種面積中,抽取部分地塊,進行調查,作為最基層階段的樣本,計算其樣本平均畝產量,然後逐級往上綜合估算平均畝產量,並推算總產量。
(5)抽樣階段數不宜過多,一般以劃分兩、三階段,至多四個階段為宜。
在多階段抽樣中,前幾個階段的抽樣,都類似整羣抽樣。每一階段抽樣都會存在抽樣誤差。為提高抽樣指標的代表性,各階段抽取羣數的安排和抽樣方式,都應注意樣本單位的均勻分佈。首先,適當多抽第一階段的羣數,使樣本單位在總體中得到均勻分佈。但是,樣本過於分散則需要更多的人力和經費。其次,根據方差的大小,來考慮各階段抽取羣數的多少。對於羣間方差大的階段,應當適當多抽一些羣;反之,則可少抽一些羣。最
後,各階段抽樣時,可以根據條件,將各種抽樣組織方式靈活運用,而且儘可能利用現成資料。
各種組織形式各有特點,在抽樣推斷過程中,結合各個階段抽樣的條件,可以把各種抽樣組織方式靈活地結合運用。 [3] 
參考資料
  • 1.    孫靜娟主編;楊光輝,杜婷副主編,統計學 第3版,清華大學出版社,2015.08
  • 2.    陳衞,劉金菊主編,社會研究方法概論=INTRODUCTION TO SOCIAL RESEARCH METHODS,清華大學出版社,2015.09
  • 3.    段小紅主編;侯希紅,李業榮副主編,統計學,中國林業出版社,2015.06