反饋

虛擬變量陷阱

虛擬變量陷阱是指一般在引入虛擬變量時要求如果有m個定性變量，在模型中引入m-1個虛擬變量。否則，如果引入m個虛擬變量，就會導致模型解釋變量間出現完全共線性的情況。^[2] 我們一般稱由於引入虛擬變量個數與定性因素個數相同出現的模型無法估計的問題，稱為“虛擬變量陷阱”。

中文名: 虛擬變量陷阱

外文名: Dummy Variable Trap^[2]

引證解釋

自變量中包含了過多的虛擬變量造成的錯誤；當模型中既有整體截距又對每一組都設有一個虛擬變量時，該陷阱就產生了。或者説，由於引入虛擬變量帶來的完全共線性現象就是虛擬變量陷阱。

比如“性別”含男性和女性兩個類別，所以當性別作為解釋變量時，應向模型引入一個虛擬變量。取值方式是：D=1（男性）、D=0（女性）或D=0（男性）、D=1（女性）而當“學歷”含有四個類別時，即大學、中學、小學、無學歷。當“學歷”作為解釋變量時，應向模型引入三個虛擬變量。一種取值方式是：1（大學）1（中學）1（小學）D1=0（非大學）D2=0（非中學）D3=0（非小學）所謂的“虛擬變量陷阱”就是當一個定性變量含有m個類別時，模型引入m個虛擬變量，造成了虛擬變量之間產生完全多重共線性，無法估計迴歸參數。在m-1個虛擬變量中，虛擬變量可以同時取值為0，但不能全部取值為1。

當定性變量含有m個類別時，不能把虛擬變量的值設為D=0（第一類）D=1（二類）D=2（三類）等等。

若對兩個相互排斥的屬性 “居民屬性”,仍然引入個虛擬變量，則有則模型為對任一家庭都有：即產生完全共線，陷入了“虛擬變量陷阱”。“虛擬變量陷阱”的實質是：完全多重共線性。^[1]

參考資料

1. 虛擬變量陷阱．MBA智庫[引用日期2020-06-27]
2. 劉亞清．統計分析軟件EVIEWS及其應用[M]．長春：吉林大學出版社，2021：63

虛擬變量陷阱的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：7次歷史版本
最近更新：阿妧云（2023-07-03）