-
方差擴大因子
鎖定
方差擴大因子(variance inflation factor)簡稱VIF,是表徵自變量觀察值之間復共線性程度的數值。線性迴歸分析中,迴歸係數βj的估計量的方差為σ2Cjj,其中Cjj=(1-Rj)-1,稱Cjj為βj的方差擴大因子,這裏Rj為xj對其餘p-1個自變量的複相關係數的平方,顯然Cjj≥1,它的大小可以反映出自變量的觀察值之間是否存在復共線性以及其程度如何,Cjj越大,復共線性越嚴重
[1]
。
- 中文名
- 方差擴大因子
- 外文名
- variance inflation factor
- 符 號
- VIF
- 別 名
- 方差膨脹因子
- 相關概念
- 多重共線性等
方差擴大因子基本介紹
方差擴大(膨脹)因子法是通過考察給定的解釋變量被方程中其他所有解釋變量所解釋的程度,以此來判斷是否存在多重共線性的一種方法。方程中的每一個解釋變量都有一個方差擴大(膨脹)因子(variance inflation factor,VIF),它反映的是多重共線性在多大程度上增大估計係數方差的指標。統計上可以證明,解釋變量
、參數估計值
的方差可表示為:
在不存在多重共線性的情況下,方差擴大因子接近於1。但是,實際上自變量之間總是或多或少地存在多重共線性,因而將方差擴大因子等於1作為評價共線性的標準是不現實的。多重共線性越強,方差擴大因子就越大。一個易用的標準:當VIF值大於10時,就認為變量之間具有強烈的多重共線性,不能接受。
如果VIF暗示自變量之間存在過於強的相關性,那麼可以採用的補救措施如下:
(1)去掉VIF較大的變量。
(2)將相關的變量組合成單一的一個變量。
方差擴大因子多重共線性的診斷
多元線性迴歸模型的一個基本假設,就是要求自變量矩陣X的列滿秩,即秩
(要求X中的列向量之間與線性無關)。如果X的列不滿秩,則
將不存在,於是基於最小二乘的迴歸係數估計,
將不存在,所以很難得出穩定的結果。
如果存在不全為0的p+1個數
,使得:
考慮線性迴歸模型:
完全多重共線性的情況並不多見,在迴歸分析之前,也很容易發現存在完全多重共線性的解釋變量。可以採用以下三種方法來判斷是否存在完全多重共線性:第一,考察一個變量是否是另一個變量的倍數;第二,考察一個變量是否等於另一個變量加上一個常數項;第三,考察一個變量是否等於另外兩個變量相加。如果存在以上幾種情況,就應該剔除其中的一個變量。
方差擴大因子方差擴大因子法
方差擴大因子(
)定義為:
可以看出,當
時
。
一般標準:
①當
時,沒有復共線性;
②當
時,有較弱的復共線性;
③當
時,有中等或較強的復共線性;
④當
時,有嚴重的復共線性。由於
(
稱為容忍值),所以也可以用
來診斷復共線性。
在此僅討論VIF,有的統計軟件給出的是容忍值。
方差擴大因子特徵根分析法
一般標準:
①當
時,可認為不存在復共線性;
②當
時,有弱的復共線性;
③當
時,有中等或較強的復共線性;
④當
時,有嚴重的復共線性。
方差擴大因子條件數法
方陣
的條件數(
)定義為:
一般標準:
①當
時,沒有復共線性;
②當
時,有較弱的復共線性;
③當
時,有中等或較強的復共線性;
④當
時,有嚴重的復共線性。
方差擴大因子直觀判定法
當增加或剔除一個自變量,或者改變一個觀測值時,迴歸係數的估計值會發生較大變化,我們就認為迴歸方程存在嚴重的多重共線性。
從定性分析的角度來看,若一些重要的自變量在迴歸方程中沒有通過顯著性檢驗,可初步判斷它們存在着嚴重的多重共線性。若自變量的迴歸係數所帶正負號與定性分析結果違背,我們就認為它們存在着多重共線性問題;自變量的相關矩陣中,自變量間的相關係數較大時,可能會出現多重共線性;一些重要的自變量的迴歸係數的標準誤差較大時,可能存在多重共線性
[3]
。