-
分組數據
鎖定
- 中文名
- 分組數據
- 外文名
- data grouping
- 分組方法
- 單變量值分組和組距分組
- 分組原則
- 遵循不重不漏
- 分組體系
- 平行分組體系、複合分組體系
- 主要目的
- 觀察數據的分佈特徵
分組數據簡介
對於通過調查得到的數據,雖然經過審核、排序等整理手段給予了處理,但由於數據龐雜,還不能直接進入對數據的分析階段。在此之前,有必要對數據進行分組處理,以反映數據分佈的特徵及規律。從一定意義上説,數據整理的中心任務就是分組和編制頻數分佈。
數據分組是根據統計研究的需要,將原始數據按照某種標準劃分成不同的組別,分組後的數據稱為分組數據。數據分組的主要目的是觀察數據的分佈特徵。數據分組後再計算出各組中數據出現的的頻數,就形成了一張頻數分佈表。
對於非數值型數據就是依據屬性的不同將其劃分為若干組,對於數值型數據就是依據數值的不同將數據劃分為若干組。分組後,要使組內的差距儘可能小,而組與組之間則有明顯的差異,從而使大量無序、混沌的數據變為有序、層次分明、顯示總體數量特徵的資料。因為,任何總體內部單位之間都是既有共性,又存在着差異性,分組便是以這些共性與差異性的對立統一為基礎的最基本的整理方法,它對於自然科學和社會科學的研究都是必不可少的。
分組數據分組原則
數據分組應遵循兩個基本原則:
分組數據窮盡性原則
這一原則就是要求調查的每一單位都能無一例外地劃歸到某一組去,不會產生“遺漏”現象。
分組數據互斥性原則
分組數據分組標誌
在選擇分組標誌時,主要有以下三個依據:
1.根據研究目的選擇分組標誌
同一現象由於研究目的不同,選擇的分組標誌也就不同,應選擇與研究目的有密切關係的標誌作為分組標誌,才能使統計分組提供符合要求的分組資料。例如,要研究工業企業經濟類型的構成,就要選擇所有制這個標誌。
2.選擇能夠反映現象本質的標誌
客觀現象的標誌多種多樣,有的標誌能夠揭示現象的本質特徵,具有決定意義的重要標誌;有的則是非本質、無關緊要的標誌。只有選擇那些能夠揭示現象本質特徵的重要標誌作為分組標誌,才能得到反映現象本質特徵的分組資料。
3.考慮現象所處的歷史條件或經濟條件
社會經濟現象隨時間、地點、條件的不同而經常發生變化。同一分組標誌在某一時期適用,在另一時期就不一定適用,在另一條件下就不一定適用。某一標誌在一定歷史條件下是重要的分組標誌,但時過境遷,可能失去其重要意義。因此,在選擇分組標誌時,應考慮到現象所處的具體歷史條件或經濟條件,做到與時俱進。
[2]
分組數據分組方法
數據分組的方法有單變量值分組和組距分組兩種。
分組數據單變量值分組
分組數據組距分組
在連續變量或變量值較多的情況下,通常採用組距分組。它是將全部變量值依次劃分為若干區間,並將這一區間的變量值作為一組。在組距分組中,一個組的最小值稱為下限;一個組的最大值稱為上限。
具體的分組步驟如下:
第1步:確定組數。一組數據分多少組合適呢?一般與數據本身的特點及數據的多少有關。由於分組的目的之一是觀察數據分佈的特徵,因此組數的多少應適中。如果組數太少,數據的分佈就會過於集中,組數太多,數據分佈就會過於分散,這都不便於觀察數據分佈的特徵和規律。組數的確定應以能夠顯示數據的分佈特徵和規律為目的。一般情況下,一組數據所分的組數應不少於5組且不多於15組。實際應用時,可根據數據的多少和特點及分析要求來確定組數。
第2步:確定各組的組距。組距是一個組的上限與下限的差。組距可根據全部數據的最大值和最小值及所分的組數來確定,及組距=(最大值-最小值)/組數。
分組數據數據分組體系
有時為了從不同側面反映總體的特徵,就必須運用幾個標誌對總體進行分組,以形成一個完整的體系,這就是數據分組體系。數據分組體系有兩種不同的形式:
分組數據平行分組體系
將數據按照一個標誌進行分組,就稱為簡單分組。將一個總體的幾個簡單分組按照某一規則排列起來就構成了一個平行分組體系。例如,分別按性別、專業、年級對大學生進行分組,這些簡單分組排列起來,就是平行分組體系。
分組數據複合分組體系
- 詞條統計
-
- 瀏覽次數:次
- 編輯次數:13次歷史版本
- 最近更新: tujiaqi大本营