複製鏈接
請複製以下鏈接發送給好友

組距分組

鎖定
組距分組是將全部變量值依次劃分為若干個區間,並將這一區間的變量值作為一組。組距分組是數值型數據分組的基本形式。離散變量的整數值如果變動幅度較大,而且總體單位數N又很大,則也要進行組距分組。 在組距分組中,各組之間的取值界限稱為組限,一個組的最小值稱為下限,最大值稱為上限;上限與下限的差值稱為組距;上限與下限值的平均數稱為組中值,它是一組變量值的代表值。
中文名
組距分組
外文名
Interval Grouping
拼    音
Zǔ jù fēn zǔ
隸    屬
數理科學
學    科
統計學
類    別
數值型數據分組的基本形式

目錄

組距分組基本內容

組距分組是將全部變量值依次劃分為若干個區間,並將這一區間的變量值作為一組。組距分組是數值型數據分組的基本形式。
在組距分組中,各組之間的取值界限稱為組限,一個組的最小值稱為下限,最大值稱為上限;上限與下限的差值稱為組距;上限與下限值的平均數稱為組中值,它是一組變量值的代表值。
把所有數據分成若干組,每個小組的兩個端點之間的距離(組內數據的取值範圍)稱為組距 [1] 

組距分組步驟

1. 確定組數。一組數據的組數一般與數據本身的特點及數據的多少有關。由於分組的目的之一是為了觀察數據分佈的特徵,因此組數的多少應適中。如組數太少,數據的分佈就會過於集中,組數太多,數據的分佈就會過於分散,這都不便於觀察數據分佈的特徵和規律。組數的確定應以能夠顯示數據的分佈特徵和規律為目的。
2.確定各組的組距。組距是一個組的上限下限的差,可根據全部數據的最大值和最小值(即極差)及所分的組數來確定,即組距=(最大值-最小值)/組數。
3.根據分組整理成頻數分佈表。 [2] 

組距分組原則

採用組距分組時,需要遵循“不重不漏”的原則。“不重”是指一項數據只能分在其中的某一組,不能在其他組中重複出現;“不漏”是指組別能夠窮盡,即在所分的全部組別中每項數據都能分在其中的某一組,不能遺漏。
為解決“不重”的問題,統計分組時習慣上規定“上組限不在內”,即當相鄰兩組的上下限重疊時,恰好等於某一組上限的變量值不算在本組內,而計算在下一組內。而對於連續變量,可以採取相鄰兩組組限重疊的方法,根據“上組限不在內”的規定解決不重的問題,也可以對一個組的上限值採用小數點的形式,小數點的位數根據所要求的精度具體確定。例如,對零件尺寸可以分組為10-11.99、12-13.99、14-15.99,等等。
在組距分組中,如果全部數據中的最大值和最小值與其他數據相差懸殊,為避免出現空白組(即沒有變量值的組)或個別極端值被漏掉,第一組和最後一組可以採取“××以下”及“××以上”這樣的開口組開口組通常以相鄰組的組距作為其組距。為了統計分析的需要,有時需要觀察某一數值以下或某一數值以上的頻數頻率之和,還可以計算出累積頻數或累積頻率 [1] 

組距分組應用

統計整理是對調查過程中得到的大量統計資料加工整理、彙總、列表的過程,處於統計工作的中間環節,起着承前啓後的作用。編制組距變量數列是數據整理過程中的一個關鍵環節,它不僅直接影響統計資料整理的科學性和準確性,而且最終影響着統計分析結果的真實性。 [3] 
參考資料
  • 1.    賈俊平,何曉羣,全勇進. 統計學[M]. 北京:中國人民大學出版社,2007.
  • 2.    白先春. 關於組距式分組的理論探討[J]. 統計與決策, 2008(18):15-16.
  • 3.    曾五一. 統計學[M]. 北京:北京大學出版社,2006.