-
混合線性模型
鎖定
- 中文名
- 混合線性模型
- 外文名
- Mixed linear model
- 所屬學科
- 數學
- 所屬領域
- 統計學(線性模型)
- 特 點
- 既含有固定效應,又含有隨機效應
- 定 義
- 在方差分量模型中,把既含有固定效應,又含有隨機效應的模型
混合線性模型基本介紹
混合線性模型是20世紀80年代初針對統計資料的非獨立性而發展起來的。由於該模型的理論起源較多,根據所從事的領域、模型用途,又可稱為多水平模型(Multilevel,MLM)、隨機係數模型(Random Coefficients,RCM)、等級線性模型(Hierarchical Linear,HLM)等。甚至和廣義估計方程也有很大的交叉。這種模型充分考慮到數據聚集性的問題,可以在數據存在聚集性的時候對影響因素進行正確的估計和假設檢驗。不僅如此,它還可以對變異的影響因素加以分析,即哪些因素導致了數據間聚集性的出現,哪些又會導致個體間變異增大。由於該模型成功地解決了長期困擾統計學界的數據聚集性問題,20年來已經得到了飛速的發展,也成為SPSS等權威統計軟件的標準統計分析方法之一
[2]
。
在傳統的線性模型(y=xb+e)中,除X與Y之間的線性關係外,對反應變量Y還有三個假定:①正態性,即Y來自正態分佈總體;②獨立性,Y的不同觀察值之間的相關係數為零;③方差齊性,各Y值的方差相等。但在實際研究中,經常會遇到一些資料,它們並不能完全滿足上述三個條件。例如,當Y為分類反應變量時,如性別分為男、女,婚姻狀態為已婚、未婚,學生成績是及格、不及格等,不能滿足條件①。當Y具有羣體特性時,如在抽樣調查中,被調查者會來自不同的城市、不同的學校,這就形成一個層次結構,高層為城市、中層為學校、低層為學生。顯然,同一城市或同一學校的學生各方面的特徵應當更加相似。也就是基本的觀察單位聚集在更高層次的不同單位中,如同一城市的學生數據具有相關性,不能滿足條件②。當自變量X具有隨機誤差時,這種誤差會傳遞給Y,使得Y不能滿足條件③。
如果對不滿足正態性、獨立性、方差齊性三個適用條件的資料採用傳統的分析方法,對所有樣本一視同仁,建立迴歸方程,就會帶來如下問題:
(1)參數估計值不再具有最小方差線性無偏性。
(2)會嚴重低估迴歸係數的標準誤差。
(3)容易導致估計值過高,使常用的檢驗失效,從而增加統計檢驗I型錯誤發生的概率。
如果我們對不同的羣體分別建立各自的迴歸模型,當羣體數較少,羣體內樣本容量較大,傳統的分析方法可能是有效的。或者,我們的興趣僅在於對這些羣體分別做一些統計推斷時,也適合用這種方法。但是如果我們把這些羣體看成是從總體中抽樣來的一個樣本(例如多階段抽樣和重複測度數據),並想分析不同羣體之間的總體差異,那麼簡單地使用傳統的統計方法是不夠的。同樣,如果一些羣體包含的樣本容量較少,對這些羣體做出的推斷也不可靠。因此,我們需要把這些羣體看成是從總體抽樣來的樣本,並使用樣本總體的信息來進行推斷
[3]
。
混合線性模型混合線性模型的結構
具有固定效應的一般線性模型的結構為:
混合線性模型將一般線性模型擴展為: