複製鏈接
請複製以下鏈接發送給好友

抽樣調查

(數學概念)

鎖定
抽樣調查是一種非全面調查,它是從全部調查研究對象中,抽選一部分單位進行調查,並據此對全部調查研究對象做出估計和推斷的一種調查方法。顯然,抽樣調查雖然是非全面調查,但它的目的卻在於取得反映總體情況的信息資料,因而,也可起到全面調查的作用。根據抽選樣本的方法,抽樣調查可以分為概率抽樣和非概率抽樣兩類。概率抽樣是按照概率論和數理統計的原理從調查研究的總體中,根據隨機原則來抽選樣本,並從數量上對總體的某些特徵作出估計推斷,對推斷出可能出現的誤差可以從概率意義上加以控制。習慣上將概率抽樣稱為抽樣調查。
中文名
抽樣調查
外文名
sampling survey
別    名
一種非全面調查
定    義
概率抽樣
所屬範圍
數字特徵
應用學科
數學
統計學

抽樣調查抽樣調查簡述

抽樣調查是一種非全面調查,抽樣調查是根據隨機的原則從總體中抽取部分實際數據進行調查,並運用概率估計方法,根據樣本數據推算總體相應的數量指標的一種統計分析方法。抽樣調查雖然是非全面調查,但它的目的卻在於取得反映總體情況的信息資料,因而,也可起到全面調查的作用。
根據抽選樣本的方法,抽樣調查可以分為概率抽樣非概率抽樣兩類。概率抽樣是按照概率論數理統計的原理從調查研究的總體中,根據隨機原則來抽選樣本,並從數量上對總體的某些特徵作出估計推斷,對推斷出可能出現的誤差可以從概率意義上加以控制。在我國,習慣上將概率抽樣稱為抽樣調查。 [1] 

抽樣調查特點

抽樣調查從研究對象的總體中抽取一部分個體作為樣本進行調查,據此推斷有關總體的數字特徵,經濟性好,實效性強,適應面廣,準確性高。
抽樣調查是根據部分實際調查結果來推斷總體標誌總量的一種統計調查方法,屬於非全面調查的範疇。它是按照科學的原理和計算,從若干單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查標誌的數據以代表總體,推斷總體。
與其它調查一樣,抽樣調查也會遇到調查的誤差和偏誤問題。通常抽樣調查的誤差有兩種:一種是工作誤差(也稱登記誤差或調查誤差),一種是代表性誤差(也稱抽樣誤差)。但是,抽樣調查可以通過抽樣設計,通過計算並採用一系列科學的方法,把代表性誤差控制在允許的範圍之內;另外,由於調查單位少,代表性強,所需調查人員少,工作誤差比全面調查要小。特別是在總體包括的調查單位較多的情況下,抽樣調查結果的準確性一般高於全面調查。因此,抽樣調查的結果是非常可靠的。
抽樣調查數據之所以能用來代表和推算總體,主要是因為抽樣調查本身具有其它非全面調查所不具備的特點,主要是:
(1)調查樣本是按隨機的原則抽取的,在總體中每一個單位被抽取的機會是均等的,因此,能夠保證被抽中的單位在總體中的均勻分佈,不致出現傾向性誤差,代表性強。
(2)是以抽取的全部樣本單位作為一個“代表團”,用整個“代表團”來代表總體。而不是用隨意挑選的個別單位代表總體。
(3)所抽選的調查樣本數量,是根據調查誤差的要求,經過科學的計算確定的,在調查樣本的數量上有可靠的保證。
(4)抽樣調查的誤差,是在調查前就可以根據調查樣本數量和總體中各單位之間的差異程度進行計算,並控制在允許範圍以內,調查結果的準確程度較高。
基於以上特點,抽樣調查被公認為是非全面調查方法中用來推算和代表總體的最完善、最有科學根據的調查方法。 [1] 

抽樣調查步驟

抽樣調查的一般步驟如下:
(1)界定總體
(2)制定抽樣框
(3)實施抽樣調查並推測總體
(4)分割總體
(5)決定樣本規模
(6)決定抽樣方式
(7)確定調查的信度和效度 [1] 

抽樣調查適用範圍

第一、不能進行全面調查的事物。有些事物在測量或試驗時有破壞性,不可能進行全面調查。如,電視的抗震能力試驗,燈泡的耐用時間試驗等。
第二、有些總體從理論上講可以進行全面調查,但實際上不能進行全面調查的事物。如,瞭解某個森林有多少棵樹,職工家庭生活狀況如何等。
第三、抽樣調查方法可以用於工業生產過程中的質量控制。
第四、利用抽樣推斷的方法,可以對於某種總體的假設進行檢驗,來判斷這種假設的真偽,以決定取捨。 [1] 

抽樣調查分類

抽樣調查概率抽樣

1.隨機抽樣——簡單隨機抽樣
這是一種最簡單的一步抽樣法,它是從總體中選擇出抽樣單位,從總體中抽取的每個可能樣本均有同等被抽中的概率。抽樣時,處於抽樣總體中的抽樣單位被編排成 1~n編碼,然後利用隨機數碼錶或專用的計算機程序確定處於1~n間的隨機數碼,那些在總體中與隨機數碼吻合的單位便成為隨機抽樣的樣本。
這種抽樣方法簡單,誤差分析較容易,但是需要樣本容量較多,適用於各個體之間差異較小的情況。
2.隨機抽樣——系統抽樣法
這種方法又稱順序抽樣法,是從隨機點開始在總體中按照一定的間隔(即“每隔第幾”的方式)抽取樣本。此法的優點是抽樣樣本分佈比較好,有好的理論,總體估計值容易計算。
3.隨機抽樣——分層抽樣法
它是根據某些特定的特徵,將總體分為同質、不相互重疊的若干層,再從各層中獨立抽取樣本,是一種不等概率抽樣。分層抽樣利用輔助信息分層,各層內應該同質,各層間差異儘可能大。這樣的分層抽樣能夠提高樣本的代表性、總體估計值的精度和抽樣方案的效率,抽樣的操作、管理比較方便。但是抽樣框較複雜,費用較高,誤差分析也較為複雜。此法適用於母體複雜、個體之間差異較大、數量較多的情況。
4.隨機抽樣——整羣抽樣法
整羣抽樣是先將總體單元分羣,可以按照自然分羣或按照需要分羣,在交通調查中可以按照地理特徵進行分羣,隨機選擇羣體作為抽樣樣本,調查樣本羣中的所有單元。整羣抽樣樣本比較集中,可以降低調查費用。例如,在進行居民出行調查中,可以採用這種方法,以住宅區的不同將住户分羣,然後隨機選擇羣體為抽取的樣本。此法優點是組織簡單,缺點是樣本代表性差。
5.隨機抽樣——多階段抽樣法
多階段抽樣是採取兩個或多個連續階段抽取樣本的一種不等概率抽樣。對階段抽樣的單元是分級的,每個階段的抽樣單元在結構上也不同,多階段抽樣的樣本分佈集中,能夠節省時間和經費。調查的組織複雜,總體估計值的計算複雜。
6.隨機抽樣——等距抽樣
等距抽樣也稱為系統抽樣、或機械抽樣,它是首先將總體中各單位按一定順序排列,根據樣本容量要求確定抽選間隔,然後隨機確定起點,每隔一定的間隔抽取一個單位的一種抽樣方式。
根據總體單位排列方法,等距抽樣的單位排列可分為三類:按有關標誌排隊、按無關標誌排隊以及介於按有關標誌排隊和按無關標誌排隊之間的按自然狀態排列。
按照具體實施等距抽樣的作法,等距抽樣可分為:直線等距抽樣、對稱等距抽樣和循環等距抽樣三種。
等距抽樣的最主要優點是簡便易行,且當對總體結構有一定了解時,充分利用已有信息對總體單位進行排隊後再抽樣,則可提高抽樣效率。
7.隨機抽樣——雙重抽樣
雙重抽樣,又稱二重抽樣、複式抽樣,是指在抽樣時分兩次抽取樣本的一種抽樣方式,其具體為:首先抽取一個初步樣本,並搜取一些簡單項目以獲得有關總體的信息;然後,在此基礎上再進行深入抽樣。在實際運用中,雙重抽樣可以推廣為多重抽樣。
8.隨機抽樣——按規模大小成比例的概率抽樣
按規模大小成比例的概率抽樣,簡稱為PPS抽樣,它是一種使用輔助信息,從而使每個單位均有按其規模大小成比例的被抽中概率的一種抽樣方式。其抽選樣本的方法有漢森-赫維茨方法、拉希裏方法等。
PPS抽樣的主要優點是:使用了輔助信息,減少抽樣誤差;主要缺點是:對輔助信息要求較高,方差的估計較複雜等。
9.隨機抽樣——任意抽樣
隨意抽取調查單位進行調查(與隨機抽樣不同,不保證每個單位相等的入選機會)如:櫃枱訪客調查,街頭路邊攔人調查。
10.非隨機抽樣——重點抽樣
只對總體中為數不多但影響頗大(標誌值在總體中所佔比重頗大)的重點單位調查。
11.非隨機抽樣——典型抽樣
挑選若干有代表性的單位進行研究。
12.非隨機抽樣——配額抽樣
對總體作若干分類和樣本容量既定情況下,按照配額從總體各部分進行抽取調查單位。 [1] 

抽樣調查非概率抽樣

非概率抽樣就是調查者根據自己的方便或主觀判斷抽取樣本的方法。
它不是嚴格按隨機抽樣原則來抽取樣本,所以失去了大數定律的存在基礎,也就無法確定抽樣誤差,無法正確地説明樣本的統計值在多大程度上適合於總體。雖然根據樣本調查的結果也可在一定程度上説明總體的性質、特徵,但不能從數量上推斷總體。 [1] 

抽樣調查常用的名詞

在抽樣調查中,常用的名詞主要有:
1、總體
總體是指所要研究對象的全體。它是根據一定研究目的而規定的所要調查對象的全體所組成的集合,組成總體的各研究對象稱之為總體單位
2、個體
個體是指總體中的每一個考察對象。
3、樣本
樣本是總體的一部分,它是由從總體中按一定程序抽選出來的那部分總體單位所組成的集合。
4、樣本的容量
樣本中個體的數量叫做樣本的容量。
抽樣框是指用以代表總體,並從中抽選樣本的一個框架,其具體表現形式主要有包括總體全部單位的名冊、地圖等。
抽樣框在抽樣調查中處於基礎地位,是抽樣調查必不可少的部分,其對於推斷總體具有相當大的影響。
6、抽樣比
抽樣比是指在抽選樣本時,所抽取的樣本單位數與總體單位數之比。
對於抽樣調查來説,樣本的代表性如何,抽樣調查最終推算的估計值真實性如何,首先取決於抽樣框的質量。
置信度也稱為可靠度,或置信水平、置信係數,即在抽樣對總體參數作出估計時,由於樣本的隨機性,其結論總是不確定的。因此,採用一種概率的陳述方法,也就是數理統計中的區間估計法,即估計值與總體參數在一定允許的誤差範圍以內,其相應的概率有多大,這個相應的概率稱作置信度。
在抽樣調查中,通常以樣本作出估計值對總體的某個特徵進行估計,當二者不一致時,就會產生誤差。因為由樣本作出的估計值是隨着抽選的樣本不同而變化,即使觀察完全正確,它和總體指標之間也往往存在差異,這種差異純粹是抽樣引起的,故稱之為抽樣誤差。
9、偏差
所謂偏差,也稱為偏誤,通常是指在抽樣調查中除抽樣誤差以外,由於各種原因而引起的一些偏差。
10、均方差
在抽樣調查估計總體的某個指標時,需要採用一定的抽樣方式和選擇合適的估計量,當抽樣方式與估計量確定後,所有可能樣本的估計值與總體指標之間離差平方的均值即為均方差。 [1] 
參考資料
  • 1.    李海波 劉學華.《新編統計學》:立信會計出版社,2005年4月:174