複製鏈接
請複製以下鏈接發送給好友

迴歸

(數學術語)

鎖定
迴歸,指研究一組隨機變量(Y1 ,Y2 ,…,Yi)和另一組(X1,X2,…,Xk)變量之間關係的統計分析方法,又稱多重回歸分析。通常Y1,Y2,…,Yi是因變量,X1、X2,…,Xk是自變量
迴歸分析是一種數學模型。
中文名
迴歸
外文名
Regression
性    質
數學術語
又    稱
多重回歸分析
定    義
研究一組隨機變量(Y1 ,Y2 ,…,Yi)和另一組(X1,X2,…,Xk)變量之間關係的統計分析方法

迴歸概念

迴歸分析是一種數學模型。當因變量和自變量為線性關係時,它是一種特殊的線性模型。 [1] 
最簡單的情形是一元線性迴歸,由大體上有線性關係的一個自變量和一個因變量組成;模型是Y=a+bX+ε(X是自變量,Y是因變量,ε是隨機誤差)。 [2] 
通常假定隨機誤差的均值為0,方差為σ^2(σ^2﹥0,σ^2與X的值無關)。若進一步假定隨機誤差遵從正態分佈,就叫做正態線性模型。一般的,若有k個自變量和1個因變量,則因變量的值分為兩部分:一部分由自變量影響,即表示為它的函數,函數形式已知且含有未知參數;另一部分由其他的未考慮因素和隨機性影響,即隨機誤差。
當函數為參數未知的線性函數時,稱為線性迴歸分析模型;當函數為參數未知的非線性函數時,稱為非線性迴歸分析模型。當自變量個數大於1時稱為多元迴歸,當因變量個數大於1時稱為多重回歸。 [3] 

迴歸迴歸分析內容

迴歸分析的主要內容有以下:
①從一組數據出發,確定某些變量之間的定量關係式;即建立數學模型並估計未知參數。通常用最小二乘法
②檢驗這些關係式的可信任程度。
③在多個自變量影響一個因變量的關係中,判斷自變量的影響是否顯著,並將影響顯著的選入模型中,剔除不顯著的變量。通常用逐步迴歸、向前迴歸和向後迴歸等方法。
④利用所求的關係式對某一過程進行預測或控制。
迴歸分析的應用非常廣泛,統計軟件包的使用可以讓各種算法更加方便。

迴歸迴歸種類

迴歸主要的種類有:線性迴歸、曲線迴歸、二元logistic迴歸、多元logistic迴歸。

迴歸分析的應用

相關分析研究的是現象之間是否相關、相關的方向和密切程度,一般不區別自變量或因變量。而回歸分析則要分析現象之間相關的具體形式,確定其因果關係,並用數學模型來表現其具體關係。 [4]  比如説,從相關分析中我們可以得知“質量”和“用户滿意度”變量密切相關,但是這兩個變量之間到底是哪個變量受哪個變量的影響,影響程度如何,則需要通過迴歸分析方法來確定。
一般來説,迴歸分析是通過規定因變量和自變量來確定變量之間的因果關係,建立迴歸模型,並根據實測數據來求解模型的各個參數,然後評價迴歸模型是否能夠很好的擬合實測數據;如果能夠很好的擬合,則可以根據自變量作進一步預測。
例如,如果要研究質量和用户滿意度之間的因果關係,從實踐意義上講,產品質量會影響用户的滿意情況,因此設用户滿意度為因變量,記為Y;質量為自變量,記為X。根據圖8-3的散點圖,可以建立下面的線性關係:
Y=A+BX+§
式中:A和B為待定參數,A為迴歸直線的截距;B為迴歸直線的斜率,表示X變化一個單位時,Y的平均變化情況;§為依賴於用户滿意度的隨機誤差項
SPSS軟件裏可以很容易地實現線性迴歸,迴歸方程如下:
質量和客户滿意度散點圖 質量和客户滿意度散點圖
y=0.857+0.836x迴歸直線在y軸上的截距為0.857、斜率0.836,即質量每提高一分,用户滿意度平均上升0.836分;或者説質量每提高1分對用户滿意度的貢獻是0.836分。
上面所示的例子是簡單的一個自變量的線性迴歸問題,在數據分析的時候,也可以將此推廣到多個自變量的多元迴歸,具體的迴歸過程和意義請參考相關的統計學書籍。此外,在SPSS的結果輸出裏,還可以彙報R2,F檢驗值和T檢驗值。R2又稱為方程的確定性係數(coefficient of determination),表示方程中變量X對Y的解釋程度。R2取值在0到1之間,越接近1,表明方程中X對Y的解釋能力越強。通常將R2乘以100%來表示迴歸方程解釋Y變化的百分比。F檢驗是通過方差分析表輸出的,通過顯著性水平(significant level)檢驗迴歸方程的線性關係是否顯著。一般來説,顯著性水平在0.05以下,均有意義。當F檢驗通過時,意味着方程中至少有一個迴歸係數是顯著的,但是並不一定所有的迴歸係數都是顯著的,這樣就需要通過T檢驗來驗證迴歸係數的顯著性。同樣地,T檢驗可以通過顯著性水平或查表來確定。在上面所示的例子中,各參數的意義如表1-1所示。
表1-1線性迴歸方程檢驗
指標
顯著性水平
意義
R
0.89

“質量”解釋了89%的“用户滿意度”的變化程度
F
276.82
0.001
迴歸方程的線性關係顯著
T
16.64
0.001
迴歸方程的係數顯著
參考資料
  • 1.    吳曾. 基於廣義線性迴歸模型的統計預測及其應用[D]. 華北電力大學(北京), 華北電力大學, 2009.
  • 2.    馬立平, 陳首麗. 描述兩個變量之間相關關係的最簡單的統計模型技術——一元線性迴歸分析[J]. 數據, 2000(9):37-38.
  • 3.    楊闊. 基於擬線性函數的迴歸方法研究[D]. 河北科技大學, 2010.
  • 4.    馮國雙. 連續變量的相關與迴歸分析[J]. 中華護理雜誌, 2011, 46(11):F0003-F0003.