反饋

組距分組

組距分組是將全部變量值依次劃分為若干個區間，並將這一區間的變量值作為一組。組距分組是數值型數據分組的基本形式。離散變量的整數值如果變動幅度較大，而且總體單位數N又很大，則也要進行組距分組。在組距分組中，各組之間的取值界限稱為組限，一個組的最小值稱為下限，最大值稱為上限；上限與下限的差值稱為組距；上限與下限值的平均數稱為組中值，它是一組變量值的代表值。

中文名: 組距分組
外文名: Interval Grouping
拼音: Zǔ jù fēn zǔ

隸屬: 數理科學
學科: 統計學
類別: 數值型數據分組的基本形式

組距分組基本內容

組距分組是將全部變量值依次劃分為若干個區間，並將這一區間的變量值作為一組。組距分組是數值型數據分組的基本形式。

在組距分組中，各組之間的取值界限稱為組限，一個組的最小值稱為下限，最大值稱為上限；上限與下限的差值稱為組距；上限與下限值的平均數稱為組中值，它是一組變量值的代表值。

把所有數據分成若干組，每個小組的兩個端點之間的距離（組內數據的取值範圍）稱為組距。^[1]

組距分組步驟

1. 確定組數。一組數據的組數一般與數據本身的特點及數據的多少有關。由於分組的目的之一是為了觀察數據分佈的特徵，因此組數的多少應適中。如組數太少，數據的分佈就會過於集中，組數太多，數據的分佈就會過於分散，這都不便於觀察數據分佈的特徵和規律。組數的確定應以能夠顯示數據的分佈特徵和規律為目的。

2.確定各組的組距。組距是一個組的上限與下限的差，可根據全部數據的最大值和最小值（即極差）及所分的組數來確定，即組距=（最大值－最小值）/組數。

3.根據分組整理成頻數分佈表。^[2]

組距分組原則

採用組距分組時，需要遵循“不重不漏”的原則。“不重”是指一項數據只能分在其中的某一組，不能在其他組中重複出現；“不漏”是指組別能夠窮盡，即在所分的全部組別中每項數據都能分在其中的某一組，不能遺漏。

為解決“不重”的問題，統計分組時習慣上規定“上組限不在內”，即當相鄰兩組的上下限重疊時，恰好等於某一組上限的變量值不算在本組內，而計算在下一組內。而對於連續變量，可以採取相鄰兩組組限重疊的方法，根據“上組限不在內”的規定解決不重的問題，也可以對一個組的上限值採用小數點的形式，小數點的位數根據所要求的精度具體確定。例如，對零件尺寸可以分組為10－11.99、12－13.99、14－15.99，等等。

在組距分組中，如果全部數據中的最大值和最小值與其他數據相差懸殊，為避免出現空白組（即沒有變量值的組）或個別極端值被漏掉，第一組和最後一組可以採取“××以下”及“××以上”這樣的開口組。開口組通常以相鄰組的組距作為其組距。為了統計分析的需要，有時需要觀察某一數值以下或某一數值以上的頻數或頻率之和，還可以計算出累積頻數或累積頻率。^[1]

組距分組應用

統計整理是對調查過程中得到的大量統計資料加工整理、彙總、列表的過程，處於統計工作的中間環節，起着承前啓後的作用。編制組距變量數列是數據整理過程中的一個關鍵環節，它不僅直接影響統計資料整理的科學性和準確性，而且最終影響着統計分析結果的真實性。^[3]

參考資料

1. 賈俊平,何曉羣,全勇進. 統計學[M]. 北京:中國人民大學出版社,2007.
2. 白先春. 關於組距式分組的理論探討[J]. 統計與決策, 2008(18):15-16.
3. 曾五一. 統計學[M]. 北京:北京大學出版社,2006.

組距分組的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：13次歷史版本
最近更新：城_time （2022-01-24）

1 基本內容
2 步驟
3 原則
4 應用

組距分組

目錄

組距分組基本內容

組距分組步驟

組距分組原則

組距分組應用