複製鏈接
請複製以下鏈接發送給好友

抽樣技術

(統計學的分支學科)

鎖定
抽樣技術(sampling techniques)是統計學的一個分支學科,研究抽樣調查中的抽樣方法及總體目標量估計方法(包括估計量的精度)的一門技術,一般地,抽樣方法可以分為兩類,概率抽樣與非概率抽樣,也可以分為順序抽樣,簡單隨機抽樣等。估計方法一般有簡單估計、比估計、迴歸估計等 [1] 
中文名
抽樣技術
外文名
Sampling techniques
所屬學科
數學(統計學)
相關概念
樣本,樣本空間,估計等
分層抽樣
先層別後再抽樣

抽樣技術基本概念

抽樣技術樣本

樣本單位樣本單位常根據樣本性狀來確定。
樣本容量:樣本容量是指樣本中含有多少個取樣單位。從理論上講,如果其它條件相同,樣本內的取樣單位越多,則由樣本所估計的值越準確,誤差越小,代表性越大。若樣本容量太小,則得不到準確的結論。但樣本容量太大,勢必大大增加工作量,造成不必要的浪費。為了保證取樣的準確,並不使工作量太大,一般取最小的樣本容量 [2] 

抽樣技術目標總體和抽樣總體

在抽樣技術裏,有着兩個相互聯繫又各具有其不同意義的總體概念,即目標總體和抽樣總體。
目標總體(the target population)是指所要了解和研究的客觀對象的全體構成的集合。目標總體是客觀存在的現實,所以也稱為客觀總體。構成目標總體的個體稱為總體單位(population units)。
抽樣總體(thesamp ling population)是指從中抽取樣本進行數據採集的具體對象的全體構成的集合,抽樣總體由已經蒐集的數據構成,抽樣總體是對客觀存在的現實映射。構成抽樣總體的個體稱為抽樣單位(sampling units)。

抽樣技術估計

從總體中隨機抽取樣本的目的就是為了對總體標誌進行估計。對所隨機抽取的樣本單元進行現場調查,獲得樣本觀察值,按照估計量的計算公式,計算估計量的觀察值,並作為總體標誌的估計值,這個過程稱為估計。利用概率抽樣的樣本,估計總體標誌的統計量為估計量。估計量也是樣本統計量
總體標誌估計結果的評價不是依據樣本的一個觀察值,而是基於樣本所有可能觀察值的平均水平。總體標誌估計結果的常用評價標準有無偏性有效性和最小均方誤差。

抽樣技術系統性偏誤

當抽樣單位與總體單位一一對應時,抽樣總體與目標總體之間具有完整的一致性;若抽樣單位與總體單位存在差別,就意味着抽樣總體和目標總體存在差別,這時通過抽樣所得到的數據推斷的總體參數就必然存在偏誤,這種偏誤為系統性偏誤
系統性偏誤(systematic bias)是指與抽樣的隨機性誤差無關的,不會隨着抽樣的樣本容量增大而減小的常數項偏誤。例如,當人們採用陳舊的,事過境遷的數據構成抽樣總體,或者採用使用時間久遠的樣本進行數據採集,或者採用街頭或網上隨意樣本進行調查,或者採用含有較多無回答問題的樣本進行參數估計,就會導致系統性偏誤。當抽樣數據含有系統性偏誤時,需要採用抽樣理論中各種糾偏方法,利用有關輔助數據來加以修正,例如可以採用抽樣後分層技術,迴歸估計技術等。抽樣總體的設計和系統性偏誤的糾偏是現代抽樣技術的重要組成部分。

抽樣技術抽樣框

抽樣框(sampling frame)是按照抽樣的目的和抽樣方法的要求,為了實施樣本的抽取而專門構造的,對抽樣總體數據進行編碼和排序,所構成的有序的數據庫。
第一,構造抽樣框的前提是必須從統計研究和抽樣目的出發。
第二,構造一個有效的抽樣框,要與具體抽樣設計中所採取的抽樣技術相適應。例如,我們要根據分層抽樣、整羣抽樣、多階段抽樣等不同的抽樣方法,以及抽樣後分層技術,迴歸估計技術等數據處理和參數估計方法的具體特點和要求來科學地構造抽樣框。
第三,構造一一個有效的抽樣框的基礎是擁有能夠如實反映目標總體現實狀況的抽樣總體數據。在已掌握的抽樣總體與目標總體存在較大差異時,則需要及時進行有關的全面調查,蒐集新鮮的全面資料,為構造有效的抽樣框提供目標總體的真實數據。在無法立即進行全面調查時,可以採用二二相抽樣方法,利用第一相抽樣資料來構造抽樣框。消除由此造成的系統性偏誤。
第四,在構造抽樣框,還要防止在採取系統抽樣方法時,發生抽樣的頻率與抽樣框資料中樣本單位的調查標誌的變動週期恰好吻合的現象,避免由此而引起的系統性偏誤。在抽樣技術中,抽樣總體和目標總體存在差別而產生系統性偏誤,往往通過抽樣框有偏的形式反映出來。通常將這種由於抽樣總體和目標總體存在差別而產生系統性偏誤,以及構造抽樣框過程中由於其他失誤新產生的系統性偏誤統稱為“抽樣框偏誤”。
從抽樣框抽取部分的抽樣單位的觀測值所構成的集合稱為樣本(sample),根據樣本計算的統計量推斷總體參數時產生的隨機誤差,稱為抽樣平均誤差。抽樣平均誤差(sampling error)是樣本統計量與總體參數真值之間誤差的測度,通常用樣本估計量的標準差來度量,一般也簡稱為抽樣誤差。樣本估計量的標準差反映了使用樣本數據來推斷總體參數時,統計量與總體參數真值之間誤差的平均水平 [3] 

抽樣技術抽樣方法

抽樣技術順序抽樣

順序抽樣也稱機械抽樣系統抽樣。按照某種既定的順序抽取一定數量的單位組成樣本,例如按總體各單位編號,或逢1或逢5等距抽樣,或間隔一定數量依次抽樣,或按照行次每隔一定行數抽取一個抽樣單位,或在同一方向位置抽樣。這種抽樣方法簡便,當抽樣單位在總體內分佈均勻時,能夠得到比較準確的結果。如表1所示 [2] 
表1 常用的順序抽樣方式
a. 對角線式 a. 對角線式
b. 交叉式 b. 交叉式
c. 棋盤式 c. 棋盤式
d. 分行式 d. 分行式
e. 平行線式 e. 平行線式
f. Z字形式 f. Z字形式

抽樣技術簡單隨機抽樣法

簡單隨機抽樣法也稱單純隨機抽樣法。一般先對總體各試驗區進行編號,然後用抽籤或隨機數字表來抽取所需數量的抽樣單位組成樣本,這能使總體內各單位被抽取的機會均等,從而能夠提高由樣本所計算估計值的可靠程度。應用這種方法,對於變異較大的總體進行抽樣,可得到較為可靠的總體估計值;如果總體變異太大,表現明顯的部分差異則往往有偏性。

抽樣技術典型抽樣

典型抽樣按調查研究的目的要求,從總體內有意識地選取一定數量的有代表性的典型抽樣單位,加以測定,至少要求所選取的單位能夠代表總體的大多數。這種抽樣方法,比較容易説明問題,但常容易喪失隨機抽樣的作用,所得的數據不適用統計分析。

抽樣技術劃區抽樣法

劃區抽樣法或稱分層抽樣法類型抽樣法。先從總體內用典型抽樣法選取典型單位羣,然後在各部分中進行隨機抽樣或順序抽樣,再根據各部分樣本數值計算總體的估計值。

抽樣技術帶狀抽樣法

帶狀抽樣法是指有的試驗需要羣體影響作為抽樣標準,需要劃分若干抽樣帶。隨機選取帶狀的產品羣體作為代表,相互比較 [2] 
參考資料
  • 1.    《數學辭海》編輯委員會.數學辭海·第四卷:中國科學技術出版社,2002
  • 2.    劉魁英主編;王有年副主編.食品研究與數據分析 第4版=FOOD RESEARCH AND DATA ANALYSIS:中國輕工業出版社,2015.01
  • 3.    盧小廣.SPSS 20與經濟管理實務教程:清華大學出版社,2015.08