複製鏈接
請複製以下鏈接發送給好友

標準迴歸係數

鎖定
標準迴歸係數,是指消除了因變量自變量所取單位的影響之後的迴歸係數,其絕對值的大小直接反映了自變量對因變量的影響程度。標準化迴歸係數的比較結果只是適用於某一特定環境的,而不是絕對正確的,它可能因時因地而變化。
中文名
標準迴歸係數
外文名
Standard regression coefficient
學    科
數學、統計學
特    點
可能因時因地而變化
別    名
Beta值
作    用
在多元迴歸中被用來比較變量間的重要性
類    型
數學術語

標準迴歸係數前提

標準化迴歸係數(Beta值)在多元迴歸中被用來比較變量間的重要性,但是由於重要性這一詞意義的含糊性,這一統計常被誤用。
有時人們説重要性,是指同樣的條件下,哪一個東西更有效。在提高教學質量上,是硬件條件更重要還是師資更重要?如果是師資更重要,那麼同樣的物力投在師資上就可以更快地提高教學質量。但是這裏要比較的兩者必須有同樣的測量單位,如成本(元)。如果變量的單位不同,我們不能絕對地説哪個變量更重要。不同單位的兩個東西是不能絕對地比出高低輕重來。要想進行絕對地比較,就需要兩個東西有着共同的測度單位,否則無法比較。

標準迴歸係數定義

數據標準化,即將原始數據減去相應變量均數後再除以該變量的標準差,計算得到的迴歸方程稱為標準化迴歸方程,相應得迴歸係數為標準化迴歸係數。

標準迴歸係數公式

若假定迴歸方程的形式如下 [1] 
其中,Y是估計值,參數
通過最小二乘法求得。
則標準化迴歸係數等於
(
的標準差
的標準差)。

標準迴歸係數實際意義

標準化迴歸係數説的重要性則與上面前提中所説的意義不同,這是一種相對的重要性,與某種情況下,自變量間的離散程度有關 [2] 
比如説,雖然我們不能絕對地説出教育和年資在決定收入上那一個一定是重要的,但如大家的教育程度比較相似,那麼在收入的決定上,工作年數就是決定因素;反之,如果工作年數沒有太大區別,那麼教育就成為了重要原因。這裏的重要性是相對的,是根據不同情況而改變的。
再舉一個通俗的例子,研究者研究的是遺傳因素和後天因素對於人成長的影響。那麼在一個社會境遇懸殊巨大的環境中,有人在貧民窟成長,有人在貴族學校上學,那麼我們會發現人格的大部分差異會從後天環境因素得到解釋,而遺傳的作用就相對較小;相反,如果兒童都是在一個相差不大的環境中長大的,你會發現,遺傳會解釋大部分的人格差異。
這種意義上的重要性,不僅與這一自變量的迴歸係數有關係,而且還與這個自變量的波動程度有關係:如果其波動程度較大,那麼就會顯得較為重要。標準化迴歸係數正是測量這種重要性的。從標準化迴歸係數的公式 中也可看出,Beta值是與自變量的標準差成正比的,自變量波動程度的增加,會使它在這一具體情況下的重要性增加。
但是如果將兩種重要性混同,就會得到誤導性結論。如環境因素的Beta值比遺傳因素的Beta值大,就認為在個體的人格發展上應更注意環境因素,而輕視遺傳因素,在對於Beta值的錯誤觀念非常流行,甚至是一些高手中。

標準迴歸係數注意

標準化迴歸係數的比較結果只是適用於某一特定環境的,而不是絕對正確的,它可能因時因地而變化。舉例來説,從某一次數據中得出,在影響人格形成的因素中,環境因素的Beta值比遺傳因素的Beta值大,這隻能説明數據採集當時當地的情況,而不能加以任何不恰當的推論,不能絕對地不加任何限定地説,環境因素的影響就是比遺傳因素大。事實上,如果未來環境因素的波動程度變小,很可能遺傳因素就顯得更為重要。
數據的情況千差萬別,變量的相對重要性也可能完全不同,但都符合當時的實際情況。
參考資料
  • 1.    駱福添, 胡孟璇. Cox模型標準迴歸係數的探討[J]. 中國衞生統計, 1992(6):5-7.
  • 2.    張尚立. 多種標準下生長曲線模型迴歸係數可容許線性估計的等價性[J]. 北京交通大學學報, 1993(2):214-218.