-
虛擬變量陷阱
鎖定
引證解釋
自變量中包含了過多的虛擬變量造成的錯誤;當模型中既有整體截距又對每一組都設有一個虛擬變量時,該陷阱就產生了。或者説,由於引入虛擬變量帶來的完全共線性現象就是虛擬變量陷阱。
比如“性別”含男性和女性兩個類別,所以當性別作為解釋變量時,應向模型引入一個虛擬變量。取值方式是:D=1(男性)、D=0(女性)或D=0(男性)、D=1(女性)而當“學歷”含有四個類別時,即大學、中學、小學、無學歷。當“學歷”作為解釋變量時,應向模型引入三個虛擬變量。一種取值方式是:1(大學)1(中學)1(小學)D1=0(非大學)D2=0(非中學)D3=0(非小學)所謂的“虛擬變量陷阱”就是當一個定性變量含有m個類別時,模型引入m個虛擬變量,造成了虛擬變量之間產生完全多重共線性,無法估計迴歸參數。在m-1個虛擬變量中,虛擬變量可以同時取值為0,但不能全部取值為1。
當定性變量含有m個類別時,不能把虛擬變量的值設為D=0(第一類)D=1(二類)D=2(三類)等等。
- 參考資料
-
- 1. 虛擬變量陷阱 .MBA智庫[引用日期2020-06-27]
- 2. 劉亞清.統計分析軟件EVIEWS及其應用[M].長春:吉林大學出版社,2021:63