複製鏈接
請複製以下鏈接發送給好友

混合線性模型

鎖定
混合線性模型(mixed linear model)是一種方差分量模型。在方差分量模型中,把既含有固定效應,又含有隨機效應的模型,稱為混合線性模型 [1] 
中文名
混合線性模型
外文名
Mixed linear model
所屬學科
數學
所屬領域
統計學(線性模型)
特    點
既含有固定效應,又含有隨機效應
定    義
在方差分量模型中,把既含有固定效應,又含有隨機效應的模型

混合線性模型基本介紹

混合線性模型是20世紀80年代初針對統計資料的非獨立性而發展起來的。由於該模型的理論起源較多,根據所從事的領域、模型用途,又可稱為多水平模型(Multilevel,MLM)、隨機係數模型(Random Coefficients,RCM)、等級線性模型(Hierarchical Linear,HLM)等。甚至和廣義估計方程也有很大的交叉。這種模型充分考慮到數據聚集性的問題,可以在數據存在聚集性的時候對影響因素進行正確的估計和假設檢驗。不僅如此,它還可以對變異的影響因素加以分析,即哪些因素導致了數據間聚集性的出現,哪些又會導致個體間變異增大。由於該模型成功地解決了長期困擾統計學界的數據聚集性問題,20年來已經得到了飛速的發展,也成為SPSS等權威統計軟件的標準統計分析方法之一 [2] 
在傳統的線性模型(y=xb+e)中,除X與Y之間的線性關係外,對反應變量Y還有三個假定:①正態性,即Y來自正態分佈總體;②獨立性,Y的不同觀察值之間的相關係數為零;③方差齊性,各Y值的方差相等。但在實際研究中,經常會遇到一些資料,它們並不能完全滿足上述三個條件。例如,當Y為分類反應變量時,如性別分為男、女,婚姻狀態為已婚、未婚,學生成績是及格、不及格等,不能滿足條件①。當Y具有羣體特性時,如在抽樣調查中,被調查者會來自不同的城市、不同的學校,這就形成一個層次結構,高層為城市、中層為學校、低層為學生。顯然,同一城市或同一學校的學生各方面的特徵應當更加相似。也就是基本的觀察單位聚集在更高層次的不同單位中,如同一城市的學生數據具有相關性,不能滿足條件②。當自變量X具有隨機誤差時,這種誤差會傳遞給Y,使得Y不能滿足條件③。
如果對不滿足正態性、獨立性、方差齊性三個適用條件的資料採用傳統的分析方法,對所有樣本一視同仁,建立迴歸方程,就會帶來如下問題:
(1)參數估計值不再具有最小方差線性無偏性。
(2)會嚴重低估迴歸係數的標準誤差。
(3)容易導致估計值過高,使常用的檢驗失效,從而增加統計檢驗I型錯誤發生的概率。
如果我們對不同的羣體分別建立各自的迴歸模型,當羣體數較少,羣體內樣本容量較大,傳統的分析方法可能是有效的。或者,我們的興趣僅在於對這些羣體分別做一些統計推斷時,也適合用這種方法。但是如果我們把這些羣體看成是從總體中抽樣來的一個樣本(例如多階段抽樣和重複測度數據),並想分析不同羣體之間的總體差異,那麼簡單地使用傳統的統計方法是不夠的。同樣,如果一些羣體包含的樣本容量較少,對這些羣體做出的推斷也不可靠。因此,我們需要把這些羣體看成是從總體抽樣來的樣本,並使用樣本總體的信息來進行推斷 [3] 
本文所討論的混合線性模型既保留了傳統線性模型中的正態性假定條件,又對獨立性和方差齊性不作要求,從而擴大了傳統線性模型的適用範圍 [3] 

混合線性模型混合線性模型的結構

具有固定效應的一般線性模型的結構為:
式中的Y表示反應變量的測量值向量,X為固定效應自變量的設計矩陣,
是與X對應的固定效應參數向量,
為剩餘誤差向量。
為在X條件下的Y的平均值向量,即
假定為獨立、等方差及均值為0的正態分佈,即
最小二乘法求參數
的估計值B。
混合線性模型將一般線性模型擴展為:
式中Z為隨機效應變量構造的設計矩陣,其構成方式與X相同。
為隨機效應參數向量,服從均值向量為0、方差協方差矩陣為G的正態分佈,表示為
為隨機誤差向量,放寬了對
的限制條件,其元素不必為獨立同分布,即對E沒有
的假定。用符號表示隨機誤差向量
,不要求
的方差、協方差矩陣R的主對角元素為
、非主對角元素為0。同時假定Cov(G,R)=0,即G與R間無相關關係。這時Y的方差、協方差矩陣變為:
Y的期望值為:
時,混合線形模型轉變為一般線形模型 [3] 
參考資料
  • 1.    《數學辭海》編輯委員會.數學辭海·第四卷:中國科學技術出版社,2002.08
  • 2.    張文彤,鍾雲飛.IBM SPSS數據分析與挖掘實戰案例精粹:清華大學出版社,2013.02
  • 3.    李健寧.多元分析及其在高等教育研究中的應用:安微大學出版社,2009.11