複製鏈接
請複製以下鏈接發送給好友

迴歸模型

鎖定
迴歸模型(regression model)對統計關係進行定量描述的一種數學模型。如多元線性迴歸的數學模型可以表示為y=β0+β1*x+εi,式中,β0,β1,…,βp是p+1個待估計的參數,εi是相互獨立且服從同一正態分佈N(0,σ2)的隨機變量,y是隨機變量;x可以是隨機變量,也可以是非隨機變量,βi稱為迴歸係數,表徵自變量因變量影響的程度。
中文名
迴歸模型
外文名
regression model
學    科
統計學
數學模型
y=β0+β1*x+εi

目錄

迴歸模型定義

迴歸模型是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析時間序列模型以及發現變量之間的因果關係。例如,司機的魯莽駕駛與道路交通事故數量之間的關係,最好的研究方法就是迴歸 [1] 

迴歸模型迴歸分析

迴歸模型重要的基礎或者方法就是迴歸分析,迴歸分析是研究一個變量(被解釋變量)關於另一個(些)變量(解釋變量)的具體依賴關係的計算方法和理論, [2]  是建模和分析數據的重要工具。在這裏,我們使用曲線/線來擬合這些數據點,在這種方式下,從曲線或線到數據點的距離差異最小。下面是迴歸分析的幾種常用方法 [3] 
1. Linear Regression線性迴歸
它是最為人熟知的建模技術之一。線性迴歸通常是人們在學習預測模型時首選的技術之一。在這種技術中,因變量是連續的,自變量可以是連續的也可以是離散的,迴歸線的性質是線性的。
線性迴歸使用最佳的擬合直線(也就是迴歸線)在因變量(Y)和一個或多個自變量(X)之間建立一種關係。
用一個方程式來表示它,即
其中a表示截距,b表示直線的斜率,e是誤差項。這個方程可以根據給定的預測變量(s)來預測目標變量的值。
2.Logistic Regression邏輯迴歸
邏輯迴歸是用來計算“事件=Success”和“事件=Failure”的概率。當因變量的類型屬於二元(1 / 0,真/假,是/否)變量時,我們就應該使用邏輯迴歸。這裏,Y的值從0到1,它可以用下方程表示。
上述式子中,p表述具有某個特徵的概率。
3. Polynomial Regression多項式迴歸
對於一個迴歸方程,如果自變量的指數大於1,那麼它就是多項式迴歸方程。如下方程所示:
在這種迴歸技術中,最佳擬合線不是直線。而是一個用於擬合數據點的曲線。
4. Stepwise Regression逐步迴歸
在處理多個自變量時,我們可以使用這種形式的迴歸。在這種技術中,自變量的選擇是在一個自動的過程中完成的,其中包括非人為操作。
這一壯舉是通過觀察統計的值,如R-square,t-stats和AIC指標,來識別重要的變量。逐步迴歸通過同時添加/刪除基於指定標準的協變量來擬合模型。下面列出了一些最常用的逐步迴歸方法:
  • 標準逐步迴歸法做兩件事情。即增加和刪除每個步驟所需的預測。
  • 向前選擇法從模型中最顯著的預測開始,然後為每一步添加變量。
  • 向後剔除法與模型的所有預測同時開始,然後在每一步消除最小顯着性的變量。
這種建模技術的目的是使用最少的預測變量數來最大化預測能力。這也是處理高維數據集的方法之一。
5. Ridge Regression嶺迴歸
嶺迴歸分析是一種用於存在多重共線性(自變量高度相關)數據的技術。在多重共線性情況下,儘管最小二乘法(OLS)對每個變量很公平,但它們的差異很大,使得觀測值偏移並遠離真實值。嶺迴歸通過給迴歸估計上增加一個偏差度,來降低標準誤差。
6. Lasso Regression套索迴歸
它類似於嶺迴歸,Lasso (Least Absolute Shrinkage and Selection Operator)也會懲罰迴歸係數的絕對值大小。此外,它能夠減少變化程度並提高線性迴歸模型的精度。看看下面的公式:
7.ElasticNet迴歸
ElasticNet是Lasso和Ridge迴歸技術的混合體。它使用L1來訓練並且L2優先作為正則化矩陣。當有多個相關的特徵時,ElasticNet是很有用的。Lasso 會隨機挑選他們其中的一個,而ElasticNet則會選擇兩個。
Lasso和Ridge之間的實際的優點是,它允許ElasticNet繼承循環狀態下Ridge的一些穩定性。

迴歸模型優點

使用迴歸分析的好處良多。 [3]  具體如下:
  1. 它表明自變量和因變量之間的顯著關係;
  2. 它表明多個自變量對一個因變量的影響強度。
迴歸分析也允許我們去比較那些衡量不同尺度的變量之間的相互影響,如價格變動與促銷活動數量之間聯繫。這些有利於幫助市場研究人員,數據分析人員以及數據科學家排除並估計出一組最佳的變量,用來構建預測模型。
參考資料
  • 1.    王濟川, 郭志剛. Logistic迴歸模型:方法與應用[M]. 高等教育出版社, 2001.
  • 2.    蒯孟娟. 基於ARIMA模型及迴歸分析的安徽省GDP預測研究[D]. 安徽農業大學, 2015.
  • 3.    戴經躍, 劉青. 幾種檢驗方法在迴歸分析中的應用[J]. 遼寧税務高等專科學校學報, 1995(2):40-42.