複製鏈接
請複製以下鏈接發送給好友

變異係數

鎖定
變異係數(Coefficient of Variation):當需要比較兩組數據離散程度大小的時候,如果兩組數據的測量尺度相差太大,或者數據量綱的不同,直接使用標準差來進行比較不合適,此時就應當消除測量尺度和量綱的影響,而變異係數可以做到這一點,它是原始數據標準差與原始數據平均數的比。CV沒有量綱,這樣就可以進行客觀比較了。事實上,可以認為變異係數和極差、標準差和方差一樣,都是反映數據離散程度的絕對值。其數據大小不僅受變量值離散程度的影響,而且還受變量值平均水平大小的影響。
中文名
變異係數/變差係數
外文名
Coefficient of Variation
別    名
離散係數、差異係數 [3] 
應用領域
數學
類    別
計數方法
定    義
概率分佈離散程度的歸一化量度

變異係數定義

概率論統計學中,變異係數,又稱“離散係數”(英文:coefficient of variation),是概率分佈離散程度的一個歸一化量度,其定義為標準差平均值之比: [1] 
變異係數(coefficient of variation)只在平均值不為零時有定義,而且一般適用於平均值大於零的情況。變異係數也被稱為標準離差率單位風險
變異係數只對由比率標量計算出來的數值有意義。舉例來説,對於一個氣温的分佈,使用開爾文或攝氏度來計算的話並不會改變標準差的值,但是温度的平均值會改變,因此使用不同的温標的話得出的變異係數是不同的。也就是説,使用區間標量得到的變異係數是沒有意義的。
變異係數分為總體變異係數和樣本變異係數。 [3] 

變異係數基本含義

變異係數
變異係數(6張)
一般來説,變量值平均水平高,其離散程度的測度值越大,反之越小。 [2] 
變異係數是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用標準差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能採用標準差,而需採用標準差與平均數的比值(相對值)來比較。標準差與平均數的比值稱為變異係數,記為C·V。變異係數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。
變異係數的計算公式為:變異係數 C·V =( 標準偏差 SD / 平均值Mean )× 100%
在進行數據統計分析時,如果變異係數大於15%,則要考慮該數據可能不正常,應該剔除。

變異係數舉例

已知某良種豬場長白成年母豬平均體重為190kg,標準差為10.5kg,而大約克成年母豬平均體重為196kg,標準差為8.5kg,試問兩個品種的成年母豬,哪一個體重變異程度大。
此例觀測值雖然都是體重,單位相同,但它們的平均數不相同,只能用變異係數來比較其變異程度的大小。
由於,長白成年母豬體重的變異係數:C.V = 10.5 / 190 * 100% = 5.53%
大約克成年母豬體重的變異係數:C.V = 8.5 / 196 * 100% = 4.34%
所以,長白成年母豬體重的變異程度大於大約克成年母豬。
注意,變異係數的大小,同時受平均數和標準差兩個統計量的影響,因而在利用變異係數表示資料的變異程度時,最好將平均數和標準差也列出。 [2] 

變異係數公式

(標準偏差SD、平均值MN)

變異係數優缺點

變異係數優點

比起標準差來,變異係數的好處是不需要參照數據的平均值。變異係數是一個無量綱量,因此在比較兩組量綱不同或均值不同的數據時,應該用變異係數而不是標準差來作為比較的參考。

變異係數缺陷

  1. 當平均值接近於0的時候,微小的擾動也會對變異係數產生巨大影響,因此造成精確度不足。
  2. 變異係數無法發展出類似於均值的置信區間的工具。

變異係數應用

變異係數在概率論的許多分支中都有應用,比如説在更新理論、排隊理論和可靠性理論中。在這些理論中,指數分佈通常比正態分佈更為常見。
由於指數分佈的標準差等於其平均值,所以它的變異係數等於一。變異係數小於一的分佈,比如愛爾朗分佈稱為低差別的,而變異係數大於一的分佈,如超指數分佈則被稱為高差別的。
參考資料
  • 1.    財務理念 互聯網檔案館的存檔,暨南大學管理學院會計系
  • 2.    羅良清、魏和清.統計學:中國財政經濟出版社,2011:49
  • 3.    吳媚,顧賽賽.變異係數的統計推斷及其應用[J].銅仁學院學報,2010,4(1):139-141144