-
Tobit模型
鎖定
Tobit模型(tobit model)是指因變量雖然在正值上大致連續分佈,但包含一部分以正概率取值為0的觀察值的一類模型。比如,在任一給定年份,有相當數量家庭的醫療保險費用支出為0,因此,雖然年度家庭醫療保險費用支出的總體分佈散佈於一個很大的正數範圍內,但在數字0上卻相當集中。它也被稱為截尾迴歸模型或刪失迴歸模型(censored regression model),屬於受限因變量(limited dependent variable)迴歸的一種。受限因變量指因變量的觀測值是連續的,但是受到某種限制,得到的觀測值並不完全反映因變量的實際狀態。主要包括斷尾迴歸模型(truncated regression model)、Tobit模型(tobit model)和樣本選擇模型(sample selection model)等。
- 中文名
- Tobit模型
- 外文名
- Tobit Model
- 所屬學科
- 數學(統計學)
- 別 名
-
截尾迴歸模型
刪失迴歸模型 - 代 表
- 斷尾迴歸模型、Tobit模型和樣本選擇模型
- 適用場景
- 家庭醫療保險測算
Tobit模型基本概念
經典的Tobit 模型是James Tobin在分析家庭耐用品的支出情況時對Probit 迴歸進行的一種推廣(Tobit一詞源自Tobin’S Probit),其後又被擴展成多種情況,Amemiya將其歸納為Ⅰ型到Ⅴ型Tobit模型。標準的Ⅰ型Tobit迴歸模型如下:
Tobit模型最大似然
當Tobit模型的誤差項滿足正態性和方差齊性時,即式(1)中,
,潛變量
滿足經典線性模型假定,服從具有線性條件均值的等方差正態分佈。在該假設條件下,Tobit模型中對於正值即
,給定x下y的密度與給定x下
的密度一樣;對於
的觀測值,由於u/a服從標準正態分佈並獨立於丁,則
Tobit模型半參數
Tobit模型最大似然估計的一致性依賴於其潛變量模型中誤差項的正態性和方差齊性,在誤差項存在序列相關(serial correlation)的情況下最大似然估計仍可以保持一致性,但其異方差和非正態分佈會導致
和
的不一致估計。檢驗Tobit模型中誤差項是否服從正態分佈的方法有Hausman檢驗、拉格朗日乘數檢驗和條件矩檢驗等。不滿足正態分佈時可選用替代的其他分佈,如指數分佈、對數正態分佈和威布爾分佈。但是假定一些其他的特定分佈並不能有效的解決問題而且有可能使問題更糟,此時可採用一些穩健的半參數方法。
刪失最小絕對離差估計CLAD(censored least absolute deviations)是Tobit模型的一種半參數估計方法,該方法假定
的中位數為0,即
,這也意味着
,如果額外假設誤差項有關於0為中心的對稱分佈,那麼條件中位數和均數就是一致的。對於經典線性模型,最小絕對離差估計LAD(Least Absolute Deviations)通過最小化誤差項的絕對值之和來獲得迴歸係數的估計值(最小一乘估計)。在Tobit 模型中只能觀測到截取的因變量y所以要對經典的LAD估計作一些改進。對任何連續隨機變量Z,可以通過選擇合適的b作為Z 分佈的中位數從而最小化函數,
。如果
的中位數是迴歸自變量和未知參數的已知函數
,那麼
的樣本條件中位數可以通過選擇適當的
來獲得,而這個
使得函數
在
處最小化。對於截取回歸模型來説,很容易證明
的中位數函數
,所以CLAD估計的目標函數為
Tobit模型迴歸係數
在實際應用中,Tobit 迴歸係數的解釋和一般線性模型的歸係數不同。它與Tobit模型中三個重要的條件期望(conditional expectation)
有關,具體應該是哪個解釋取決於實際應用的目的,將這些條件期望對協變量進行求導後就是想要得到的邊際效應(marginal effects)。
Tobit模型假設檢驗
在Tobit 模型中可以用似然比檢驗檢驗迴歸係數,既適合單個自變量的假設檢驗又適合多個自變量的同時檢驗。
似然比檢驗基於不受約束模型和受約束模型的對數似然函數之差。其思想是,由於似然估計最大化了對數似然函數,所以去掉變量一般會導致一個較小的對數似然函數值。對數似然函數值的下降程度是否大到足以斷定去掉的變量是重要的,可以通過似然比統計量和一系列臨界值做出判斷。似然比統計量是對數似然值之差的2倍即
為不受約束模型即含有待檢因素的Tobit 模型的對數似然值,
為受約束模型即不包含待檢因素的Tobit 模型的對數似然值。似然比統計量在
下服從漸近
分佈,自由度為待檢參數的個數q。