-
迴歸
(數學術語)
鎖定
迴歸,指研究一組隨機變量(Y1 ,Y2 ,…,Yi)和另一組(X1,X2,…,Xk)變量之間關係的統計分析方法,又稱多重回歸分析。通常Y1,Y2,…,Yi是因變量,X1、X2,…,Xk是自變量。
迴歸分析是一種數學模型。
- 中文名
- 迴歸
- 外文名
- Regression
- 性 質
- 數學術語
- 又 稱
- 多重回歸分析
- 定 義
- 研究一組隨機變量(Y1 ,Y2 ,…,Yi)和另一組(X1,X2,…,Xk)變量之間關係的統計分析方法
迴歸概念
通常假定隨機誤差的均值為0,方差為σ^2(σ^2﹥0,σ^2與X的值無關)。若進一步假定隨機誤差遵從正態分佈,就叫做正態線性模型。一般的,若有k個自變量和1個因變量,則因變量的值分為兩部分:一部分由自變量影響,即表示為它的函數,函數形式已知且含有未知參數;另一部分由其他的未考慮因素和隨機性影響,即隨機誤差。
迴歸迴歸分析內容
迴歸分析的主要內容有以下:
①從一組數據出發,確定某些變量之間的定量關係式;即建立數學模型並估計未知參數。通常用最小二乘法。
②檢驗這些關係式的可信任程度。
③在多個自變量影響一個因變量的關係中,判斷自變量的影響是否顯著,並將影響顯著的選入模型中,剔除不顯著的變量。通常用逐步迴歸、向前迴歸和向後迴歸等方法。
④利用所求的關係式對某一過程進行預測或控制。
迴歸分析的應用非常廣泛,統計軟件包的使用可以讓各種算法更加方便。
迴歸迴歸種類
迴歸主要的種類有:線性迴歸、曲線迴歸、二元logistic迴歸、多元logistic迴歸。
迴歸分析的應用
相關分析研究的是現象之間是否相關、相關的方向和密切程度,一般不區別自變量或因變量。而回歸分析則要分析現象之間相關的具體形式,確定其因果關係,並用數學模型來表現其具體關係。
[4]
比如説,從相關分析中我們可以得知“質量”和“用户滿意度”變量密切相關,但是這兩個變量之間到底是哪個變量受哪個變量的影響,影響程度如何,則需要通過迴歸分析方法來確定。
一般來説,迴歸分析是通過規定因變量和自變量來確定變量之間的因果關係,建立迴歸模型,並根據實測數據來求解模型的各個參數,然後評價迴歸模型是否能夠很好的擬合實測數據;如果能夠很好的擬合,則可以根據自變量作進一步預測。
例如,如果要研究質量和用户滿意度之間的因果關係,從實踐意義上講,產品質量會影響用户的滿意情況,因此設用户滿意度為因變量,記為Y;質量為自變量,記為X。根據圖8-3的散點圖,可以建立下面的線性關係:
Y=A+BX+§
在SPSS軟件裏可以很容易地實現線性迴歸,迴歸方程如下:
y=0.857+0.836x迴歸直線在y軸上的截距為0.857、斜率0.836,即質量每提高一分,用户滿意度平均上升0.836分;或者説質量每提高1分對用户滿意度的貢獻是0.836分。
上面所示的例子是簡單的一個自變量的線性迴歸問題,在數據分析的時候,也可以將此推廣到多個自變量的多元迴歸,具體的迴歸過程和意義請參考相關的統計學書籍。此外,在SPSS的結果輸出裏,還可以彙報R2,F檢驗值和T檢驗值。R2又稱為方程的確定性係數(coefficient of determination),表示方程中變量X對Y的解釋程度。R2取值在0到1之間,越接近1,表明方程中X對Y的解釋能力越強。通常將R2乘以100%來表示迴歸方程解釋Y變化的百分比。F檢驗是通過方差分析表輸出的,通過顯著性水平(significant level)檢驗迴歸方程的線性關係是否顯著。一般來説,顯著性水平在0.05以下,均有意義。當F檢驗通過時,意味着方程中至少有一個迴歸係數是顯著的,但是並不一定所有的迴歸係數都是顯著的,這樣就需要通過T檢驗來驗證迴歸係數的顯著性。同樣地,T檢驗可以通過顯著性水平或查表來確定。在上面所示的例子中,各參數的意義如表1-1所示。
表1-1線性迴歸方程檢驗
指標 | 值 | 顯著性水平 | 意義 |
R | 0.89 | “質量”解釋了89%的“用户滿意度”的變化程度 | |
F | 276.82 | 0.001 | 迴歸方程的線性關係顯著 |
T | 16.64 | 0.001 | 迴歸方程的係數顯著 |