-
變量數列
鎖定
- 中文名
- 變量數列
- 外文名
- series of variates
- 全 稱
- 變量分配數列
- 類 型
- 單項數列和組距數列
- 學 科
- 數學
- 應 用
- 統計分析
- 定 義
- 統計總體單位按一定的數量標誌分組所構成的分配數列
變量數列基本內容
數據分組分為單項分組與組距分組。
單項分組:將變量的不同取值作為一組的組別,變量有多少個不同的取值就劃分為多少組。
組距分組:將變量的全部取值按照其大小的順序劃分成若干個不同數值的區間。連續型變量,或取值較多的離散型變量採用組距分組。
集中趨勢:指總體中各單位的次數分佈從兩邊向中間集中的趨勢,用平均指標來反映。
變量數列分類
1.單項變量數列
單項變量數列,是指在變量數列中的每一個組,只用一個變量值來表示所形成的數列。單項變量數列的應用受到一定的限制,一般僅適用於數列變異幅度不太大的情況;如果數列的變異範圍很大,就要採用組距數列。
2.組距數列
變量數列編制過程
1.確定組數
組距分組的組數通常選取在5-20組之間;變量值變化不均勻應採用異距分組;變量值變化均勻應採用等距分組;等距分組便於比較和分析處理,實踐中應儘量採用等距分組確定組距。
2.確定組距
一般用公式
計算出的值為組距的最小值,在實際分組中,為了使全部變量值都能有組可入,實際的組距只能比此值大。
3.確定組限
組限應儘量採用整數,特別是5和10的倍數。離散型變量鄰組的上下限可以不用同一個數值,連續型變量鄰組的上下限必須用同一個數值。
鄰組的上下限為同一數值時,約定:上限不包含在本組之內,稱為上限不在內原則。
4.計算各組的次數(頻數)
編制説明
關於編制變量數列,還有以下各點需要説明:
1.變量有連續變量與非連續變量之分。所謂連續變量,就是在一個變量數列中,相鄰的兩個變量值都是連續不斷的,如產值、產量、貿易額等,都可以用小數來表示的變量;所謂非連續變量,就是在一個變量數列中,相鄰的兩個變量值都是可以間斷的,如職工人數、工廠數、商店數、機器台數等,這些變量都只能用整數來表示。
用連續變量來編制的組距數列,不論是等距數列,還是異距數列,上一組的下限與相鄰下一組的上限可以重合。
3、在編制異距數列時,組數和組距應根據現象的特點來確定;而在編制等距數列時,便要經常編制組距為5或10的等距數列。這時,確定組數和組距的經驗作法是:將總體單位某一數量標誌的最大值減去最小值算出全距,然後除以10或5,即可算出組數和組距來。例如,某外貿企業有職工300人,最高的工資為106元,最低的工資為30元,其全距為76,假如每隔10為一組,則可算出組數為8組,於是將全部職工人數分在30—40,40—50,⋯100—110 等八個組中去,便可編制出以組距為10的等距數列
[4]
。
變量數列測度分析
變量數列集中趨勢的測度
測定集中趨勢的意義:可以反映現象總體的客觀規定性;可以對比同類現象在不同的時間、地點和條件下的一般水平;可以分析現象之間的依存關係。
平均指標的種類及計算方法
算術平均數適用於總體資料未經分組整理、尚為原始資料的情況。
調和平均數是總體各單位標誌值倒數的算術平均數的倒數,又叫倒數平均數。簡單調和平均數適用於總體資料未經分組整理、尚為原始資料的情況;加權調和平均數適用於總體資料經過分組整理形成變量數列的情況。
中位數是指將總體各單位標誌值按大小順序排列後,指處於數列中間位置的標誌值。不受極端數值的影響,在總體標誌值差異很大時,具有較強的代表性。
變量數列離散趨勢的測度
離散趨勢用標誌變異指標來反映。變異指標值越大,平均指標的代表性越小;反之,平均指標的代表性越大。
測定離散趨勢的意義:用來衡量和比較平均數代表性的大小;用來反映社會經濟活動過程的均衡性和節奏性;用來總體標誌值分佈較正態分佈的偏離程度。
標誌變異指標的種類及計算
極差指所研究的數據中,最大值與最小值之差,又稱全距。優點:計算方法簡單、易懂;缺點:易受極端數值的影響,不能全面反映所有標誌值差異大小及分佈狀況,準確程度差。往往應用於生產過程的質量控制中。
平均差是各個數據與其算術平均數的離差絕對值的算術平均數。優點:不易受極端數值的影響,能綜合反映全部單位標誌值的實際差異程度;缺點:用絕對值的形式消除各標誌值與算術平均數離差的正負值問題,不便於作數學處理和參與統計分析運算。一般情況下都是通過計算另一種標誌變異指標——標準差,來反映總體內部各單位標誌值的差異狀況。
標準差是各個數據與其算術平均數的離差平方的算術平均數的開平方根。不易受極端數值的影響,能綜合反映全部單位標誌值的實際差異程度;用平方的方法消除各標誌值與算術平均數離差的正負值問題,可方便地用於數學處理和統計分析運算。