複製鏈接
請複製以下鏈接發送給好友

曲線估計

鎖定
線性迴歸不能解決所有的問題。儘管有可能通過一些函數的轉換,在一定範圍內將因、自變量之間的關係轉換為線性關係,但這種轉換有可能導致更為複雜的計算或失真。SPSS提供了11種不同的曲線迴歸模型中。如果線性模型不能確定哪一種為最佳模型,可以嘗試選擇曲線擬合的方法建立一個簡單而又比較合適的模型。 [1] 
中文名
曲線估計
外文名
curve estimation
所屬學科
數學
相關概念
線性模型、非線性關係等

曲線估計概念

線性迴歸可以滿足許多數據分析,然而線性迴歸不會對所有的問題都適用,有時被解釋變量與解釋變量是通過一個已知或未知的非線性函數關係相聯繫的。變量之間的非線性關係可以劃分為本質線性關係非本質線性關係。所謂本質線性關係是指變量關係形式上雖然是非線性關係,但可通過變量變換化為線性關係,並可最終進行線性迴歸分析建立線性模型;非本質線性關係是指變量關係不僅形式上呈非線性關係,而且也無法通過變量變換化為線性關係,最終無法進行線性迴歸分析建立線性模型。而曲線估計是解決本質線性關係問題的。 [2] 

曲線估計模型

用户如果不能馬上根據專業知識或是觀測量數據本身的特點確定一種最佳模型,也可以利用曲線估計在11種不同的迴歸模型中選擇建立一個簡單而又比較適合的模型。SPSS可完成表1中有關曲線擬合的功能。
表1 不同模型的表示
模型名
迴歸方程
變量變換後的線性方程
二次曲線(Quadratic)
複合曲線(Compound)
增長曲線(Growth)
對數曲線(Logarithmic)
三次曲線(Cubic)
S曲線(S)
指數曲線(Exponential)
逆函數(Inverse)
冪函數(Power)
邏輯函數(Logistic)
在SPSS曲線估計中,首先,在不能明確究竟哪種模型更接近樣本數據時可在多種可選擇的模型中選擇幾種模型;然後,SPSS自動完成模型的參數估計,並輸出迴歸方程顯著性檢驗的F值和相伴概率p值、判定係數R2等統計量;最後,以判定係數為主要依據選擇其中的最優模型,並進行預測分析等。另外,SPSS曲線估計還可以以時間為解釋變量,實現時間序列的簡單迴歸分析和趨勢外推分析。 [2] 

曲線估計步驟

在實際問題中,當不能確定哪種曲線模型最接近樣本數據時,可以運用曲線估計、曲線估計過程可以用於擬合許多常用的曲線,原則上只要兩個變量之間存在某種可以被它所描述的數量關係,就可以用曲線估計過程來分析,曲線估計的基本步驟是:
(1)根據實際問題本身特點,選擇幾種常見的曲線模型;
(2)運用最小二乘法來完成每一種曲線模型的參數估計,並顯示R方、F檢驗值、相伴概率值以及模型的相關係數等統計量;
(3)對參數估計的相關統計量進行檢驗,看其是否通過顯著性檢驗
(4)預測。選擇R方統計量值最大的模型作為首選的曲線模型。 [3] 

曲線估計數據要求

(1)解釋變量與被解釋變量應該是數值型變量。如果在解釋變量中選擇了時間選項,要求被解釋變量是以一定的時間量度的變量。在進行時間分析時,要求數據文件中的每一個觀測量所使用的時間間隔和長度單位是完全統一的;
(2)模型的殘差應該是任意且呈現正態分佈的。如果選擇了線性模型,被解釋變量必須是正態分佈的,且所有的觀測值應該是獨立的。 [2] 

曲線估計實現

1.打開注對話框
建立或打開數據文件後,按Analyze
Regression
Curve Estimation的順序打開主對話框。
2.選擇被解釋變量
在源變量框中選擇一個或多個被解釋變量,送人Dependent(s)框中。
3.選擇解釋變量
在源變量框中選擇解釋變量,送人Independent框中,或者直接指定時間選項(time)作為解釋變量。如果選擇了時間作為解釋變量,那麼被解釋變量應該是用時間量度的變量。
4.選擇觀測量
在左側源變量框中選擇標示觀測量的變量放入Case Labels框中。
5.選擇擬合模型
在Models欄中選擇一個或多個擬合模型,各模型解釋見表1。
6.選擇相關選項
(1)Include constant in equation:方程包含常數項,系統默認值。
(2)Plot models:繪製曲線擬合圖,系統默認值。
(3)Display ANOVA Table:結果中顯示方差分析表。
7.打開Save對話框
單擊“Save”變量儲存按鈕,激活變量儲存對話框。
(1)Save Variables選項:保存變量。點擊一個或全部選項,可將相應的數值以新變量形式儲存到數據庫中,這些變量的定義將在結果中顯示。其中,Predicted Values代表被解釋變量的預測值;Residuals代表殘差(觀察值與預測值之差)選項;Prediction Intervals代表預測值區間(上下限)選項;Confidence Interval代表可信區間選項。
(2)Predict Case選項:預測觀測量。如果解釋變量為時間變量,可以在該欄中指定一種超出當前數據時間序列範圍的預測週期。
①Predict from estimation period through last case選項:使用預先設定好的估計週期中的數據,求出所有觀測量的預測值。要完成這一步,必須先通過Data菜單中Select Cases選項中的Select
Base on time or case range定義估計週期,當前的估計週期顯示在對話框的底部。如果沒有預先設置估計週期,計算時使用所有的觀測量。
②Predict through選項:根據預先設定的週期,使預測值通過特定的數據、時間或者特定的觀測量。如果預測值的範圍超出了時間序列的範圍,應該選擇該選項,並在隨後的Observation框中輸入一個預測週期的末端值。
8.單擊OK按鈕提交運行
在大多數情況下,對變量之間關係的認識往往模糊不清,需要先繪製散點圖
根據數據分佈的特點,確定應採用的模型。可以多指定幾個模型進行擬合檢驗,根據輸出的統計量,例如R2值,結合圖形綜合考慮,確定最佳圖形。 [2] 
參考資料
  • 1.    盧紋岱,硃紅兵.SPSS統計分析(第5版):電子工業出版社,2015.04
  • 2.    黎毅.會計實證研究方法:東北財經大學出版社,2012.08
  • 3.    宋宇辰,孟海東,張璞.可持續發展能源求系統建模研究:冶金工業出版社,2013.10