-
比例抽樣
鎖定
- 中文名
- 比例抽樣
- 外文名
- proportional sampling
- 學 科
- 數理科學
- 類 型
- 數學術語
- 特 點
- 按一定比例進行抽樣
- 典型方法
- 分層比例抽樣
- 定 義
- 從欲研究的全部樣品中抽取一部分樣品單位
目錄
- 1 抽樣
- 2 簡介
- 3 分層比例抽樣
- 4 基於放回比例抽樣的再抽樣方法
比例抽樣抽樣
抽樣又稱取樣。從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是要保證所抽取的樣品單位對全部樣品具有充分的代表性。抽樣的目的是從被抽取樣品單位的分析、研究結果來估計和推斷全部樣品特性,是科學實驗、質量檢驗、社會調查普遍採用的一種經濟有效的工作和研究方法。
一般抽樣的過程如下:
1、界定總體
界定總體就是在具體抽樣前,首先對從總抽取樣本的總體範圍與界限作明確的界定。
2、制定抽樣框
這一步驟的任務就是依據已經明確界定的總體範圍,收集總體中全部抽樣單位的名單,並通過對名單進行統一編號來建立起供抽樣使用的抽樣框。
3、決定抽樣方案
4、實際抽取樣本
實際抽取樣本的工作就是在上述幾個步驟的基礎上,嚴格按照所選定的抽樣方案,從抽樣框中選取一個個抽樣樣單位,構成樣本。
5、評估樣本質量
比例抽樣簡介
比例抽樣分層比例抽樣
它是根據某些特定的特徵,將總體分為同質、不相互重疊的若干層,再從各層中獨立抽取樣本,是一種不等概率抽樣。分層抽樣利用輔助信息分層,各層內應該同質,各層間差異儘可能大。這樣的分層抽樣能夠提高樣本的代表性、總體估計值的精度和抽樣方案的效率,抽樣的操作、管理比較方便。但是抽樣框較複雜,費用較高,誤差分析也較為複雜。此法適用於母體複雜、個體之間差異較大、數量較多的情況。
比例抽樣基於放回比例抽樣的再抽樣方法
數據挖掘本質上作為一類數據分析方法,和統計學有着共同的目標:發現數據中的結構川。因而,基於數據挖掘的視角,對抽樣調查數據採用一些數據挖掘的方法進行分析,是可行的。然而,將數據挖掘方法應用於抽樣調查數據,有一個問題通常無法迴避,那就是樣本數據所對應的權數如何處理。
一般而言,數據挖掘問題常常針對總體數據,例如關於一個公司的所有職工數據,銀行信用卡中心數據庫的所有客户數據,一家大型超市一個季度以來的所有顧客購買記錄等。在這種情形下,每一條記錄都是總體數據中的一個單元,得到的觀察值可以直接計算總體參數,無需進行統計推斷。
但數據挖掘方法也越來越多地應用於抽樣調查數據。與總體數據不同的是,抽樣調查當中,每個樣本單元的觀測值都是有權數的,權數表示的是每個樣本單元代表了總體中一定數目的單元,所以整個樣本就“代表”了整個總體。樣本單元的權數取決於抽樣設計。