複製鏈接
請複製以下鏈接發送給好友

聚類取樣

鎖定
聚類取樣(Cluster Sampling)又稱整羣抽樣。是將總體中各單位歸併成若干個互不交叉、互不重複的集合,稱之為羣;然後以羣為抽樣單位抽取樣本的一種抽樣方式。應用整羣抽樣時,要求各羣有較好的代表性,即羣內各單位的差異要大,羣間差異要小。 [1] 
中文名
聚類取樣
外文名
Cluster Sampling
心理學
心理統計

聚類取樣定義

取樣又稱抽樣,即從目標事物中選擇有代表性的樣本。取樣又稱為採樣,即採集樣本。通俗解釋:從大量物品或材料中抽取少數做樣品。取樣可以分為隨機取樣和非隨機取樣兩種,而判斷取樣屬於隨機取樣的一種。

聚類取樣實施步驟

先將總體分為i個羣,然後從i個羣中隨機抽取若干個羣,對這些羣內所有個體或單元均進行調查。抽樣過程可分為以下幾個步驟:
1、確定分羣的標註
2、總體(N)分成若干個互不重疊的部分,每個部分為一羣。
3、據各樣本量,確定應該抽取的羣數。
4、採用簡單隨機抽樣或系統抽樣方法,從i羣中抽取確定的羣數。
例如,調查中學生患近視眼的情況,抽某一個班做統計;進行產品檢驗;每隔8h抽1h生產的全部產品進行檢驗等。

聚類取樣適用情況

整羣抽樣方法的運用,需要與分層抽樣方法區別。
當某個總體是由若干個有着自然界限和區分的子羣(或類別、層次)所組成,同時,不同子羣相互之間差很大、而每個子羣內部的差異不大時,則適合於分層抽樣的方法;反之,當不同子羣之間差別不大、而每個子羣內部的異質性比較大時,則特別適合於採用整羣抽樣的方法。

聚類取樣優缺點

優點:整羣抽樣的優點是實施方便、節省經費。
缺點:往往由於不同羣之間的差異較大,由此而引起的抽樣誤差往往大於簡單隨機抽樣,且樣本分佈面不廣、樣本對總體的代表性相對較差。

聚類取樣誤差

整羣抽樣的誤差視各羣單位方差大小而定,各羣單位方差的簡單平均數是計算其抽樣平均誤差的依據。從公式上看,整羣抽樣平均誤差的公式與類型抽樣平均誤差的公式相似,用R表示全及總體中劃分的羣(組)數。r表示被抽中的羣(組)數。表示抽樣總體各羣(組)方差的平均數

聚類取樣取樣分類

聚類取樣隨機抽樣法

調查對象總體中每個部分都有同等被抽中的可能,是一種完全依照機會均等的原則進行的抽樣調查方法。隨機抽樣法主要有簡單隨機抽樣、系統抽樣、分組抽樣、分層抽樣四種。 [2] 
是指從總體N個單位中任意抽取n個單位作為樣本,使每個可能的樣本被抽中的概率相等的一種抽樣方式。簡單隨機抽樣的缺陷在於事先要把研究對象編號,比較費時、費力。當樣本容量較小時,可能發生偏向,影響樣本的代表性。
②系統抽樣(又稱等距抽樣
是指先將總體的全部單元按照一定順序排列,採用簡單隨機抽樣抽取第一個樣本單元(或稱為隨機起點),再順序抽取其餘的樣本單元的一種抽樣方式。相對於簡單隨機抽樣方式,系統抽樣最主要的優勢就是經濟性。等距抽樣方式比簡單隨機抽樣更為簡單,花的時間更少,並且花費也少。使用等距抽樣方式最大的缺陷在於總體單位的排列上。
③分組抽樣(又稱整羣抽樣
即按照某一標準將總體單位分成“羣”或“組”,從中抽選“羣”或“組”,然後把被抽出的“羣”或“組”所包含的個體合在一起作為樣本,被抽出的“羣”或“組”的所有單位都是樣本單位,最後利用所抽“羣”或“組”的調查結果推斷。這種抽樣方法的優點是實施方便、節省經費。缺點是往往由於不同羣之間的差異較大,由此而引起的抽樣誤差往往大於簡單隨機抽樣、樣本分佈面不廣、樣本對總體的代表性相對較差等。
④分層抽樣
是從一個可以分成不同子總體(或稱為層)的總體中,按規定的比例從不同層中隨機抽取樣品(個體)的方法。這種方法的優點是,能夠避免簡單隨機抽樣中樣本集中於某種特性或缺少某種特性的現象,樣本的代表性比較好,抽樣誤差比較小。缺點是抽樣手續較簡單隨機抽樣還要繁雜些。

聚類取樣非隨機抽樣法

抽樣時不是遵循隨機原則,而是按照研究人員的主觀經驗或其它條件來抽取樣本的一種抽樣方法。主要有偶遇抽樣、判斷抽樣、等額抽樣、滾雪球抽樣。
是指完全按調查者的意願選取樣本的一種方法。這種抽樣方法的優點是方便、靈活,簡便易行,及時取得所需資料,節約時間和費用成本低。缺點是由於個體差異性,抽樣誤差很大,結果不夠可靠,應用價值較低。
是指由市場調查的專家依據自己的判斷來選取樣本的一種方法。優點是按照調查人員的需要來選定樣本,所以較好地滿足了特殊的調查需要。缺點是如果調查人員在選取樣本時主觀判斷出現偏差,則判斷抽樣極易發生較大的抽樣誤差。
③等額抽樣(配額抽樣
是指按照一定的標準確定地區別和職業別等不同羣體的樣本配額,然後由調查人員主觀地抽取配額內樣本的方法。這種抽樣適用於設計調查者對總體的有關特徵具有一定的瞭解而樣本數較多的情況下,實際上,配額抽樣屬於先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個體)。優點是費用不高,易於實施,能滿足總體比例的要求。缺點是容易掩蓋不可忽略的偏差。
是指先隨機選擇一些被訪者並對其實施訪問,再請他們提供另外一些屬於所研究目標總體的調查對象,根據所形成的線索選擇此後的調查對象的抽樣方法。這種抽樣方法的優點是調查費用大大減少,缺點是樣本很可能出現偏差,不能很好地代表整個總體。
參考資料
  • 1.    賈俊平.統計學:人民大學出版社,2000
  • 2.    甘怡羣.心理與行為科學統計:北京大學出版社,2005