複製鏈接
請複製以下鏈接發送給好友

正交多項式迴歸

鎖定
正交多項式迴歸是用正交多項式表安排試驗和迴歸分析處理數據。它與用最小二乘法配製的一般多項式迴歸不同,其迴歸係數的估計是互相獨立的,若統計檢驗某一迴歸係數與零無顯著性差異,只需從迴歸方程中刪去這一項,而無需對其他的迴歸係數重新進行計算。
多項式迴歸雖然是一種有效的統計方法,但這種方法存在着兩個缺點:一是計算量較大,特別是當自變量個數較多,或者自變量冪較高時,計算量迅速增加;二是迴歸係數間存在着相關性,從而剔除一個變量後還必須重新計算求出迴歸係數。
當自變量x的取值是等間隔時,可以利用正交性原理有效地克服上述缺點。這種多項式迴歸方法就是正交多項式迴歸。 [1] 
中文名
正交多項式迴歸
外文名
Orthogonal polynomial regression
分    類
統計方法
學    科
數理科學
用    途
處理數據

正交多項式迴歸正交多項式

對於定義在區間上[a,b]的一個函數系
,如果其中任何兩個函數在此區間上的積分為零,而他們之中每個函數自乘的積分不等於零,即
則稱此函數係為在此區間上關於權函數
正交函數系
時稱之為規範的正交函數系;當此函數系中每一個函數均為多項式時稱之為正交多項式(系)。 [2] 

正交多項式迴歸數學模型

設變量y和x的n組觀測數據服從以下k次多項式
分別是x的一次,二次,...,k次多項式,
是一些適當選擇的常數,如何選擇將在下面討論(i=1,2,…,n)。將(2)式帶入(1)式,則有
比較(3)和(1)式可知,二者係數間存在簡單的函數關係,只要求出
,就可以求出
若把
看作新的自變量,則(3)式就成為一個k元線性模型,其結構矩陣為
正規方程為
其中
在多項式迴歸中遇到的困難是解正規方程係數矩陣的工作量太大,可以使其對角線上的元素不為零,而其餘元素均為零,從而簡化計算,而且同時消去了係數間的相關性。
對於
我們可以通過選擇係數
使得
從而使
迴歸係數為
滿足(7)和(8)式的多項式組…我們稱之為正交多項式
在正交多項式迴歸中自變量的選擇是等間隔的,設間隔為h,x0=a, 則
若令
是1至n的正整數。
為簡化問題,用
代替x作為自變量。在條件許可時,取自變量x1=1,x2=2,…,xn=n。當x1=1,x2=2,…,xn=n時有
,這時驗證以下多項式是正交的,即
顯然,當x取正整數時,
不一定是整數,為了克服這給計算上帶來的困難,取
使x取正整數時
是整數。可以驗證用正交多項式
代替
所求得的迴歸方程與用正交多項式
所求得的迴歸方程是完全一樣的。
對於正交多項式
不同的n相對應的
時的值以及Si值都已製成正交多項式表,根據正交多項式表,可以計算出迴歸方程的係數。令
迴歸方程為
由於正交多項式迴歸係數之間不存在相關性,因此某一項如果不顯著,只要將它剔除即可,而不必對整個迴歸方程重新計算。 [1] 

正交多項式迴歸迴歸係數的顯著性檢驗

正交多項式迴歸方程與迴歸係數的顯著性檢驗可利用正交多項式的性質按表1進行。經檢驗不顯著的高次項可以剔除,將其效應併入殘差平方和,自由度也同時併入,如果對迴歸方程精度不滿意,可以增加高次項,而已經計算出的結果不必重算。 [1] 
表1 正交多項式迴歸方差分析表
方差來源
平方和
自由度
均方
F
顯著性
迴歸
k

一次項
1

二次項
1

...
...
...
...
...
...
k次項
1

殘差
n-k-1


總計
n-1



正交多項式迴歸程序框圖

1.數學模型:
2.變量及數組説明:
J-正確讀入數據的控制變量;
N-試驗組數;
M-所取正交多項式項數;
X(I)-存自變量數值;
Y(I)-存因變量數值;
Z(I)-存Y(I)的平方項;
E(I,1)-存在正交多項式一次項
E(I,2)-存在正交多項式二次項
E(I,3)-存在正交多項式三次項
(其中I=1,…N);
S(J)-結構矩陣逆矩陣元素 J=1,2,3;
B(J)-常數項矩陣B J=1,2,3;
D(J)-迴歸係數 J=0,1,2,3;
Q(J)-偏迴歸平方和 J=0,1,2,3;
S-標準離差;
S1-總平方和;
F(J)-F檢驗值。
3.程序框圖:如圖1所示 [1] 
圖1 圖1
參考資料
  • 1.    薛為民.正交多項式迴歸及其應用:化學工業出版社,1989
  • 2.    正交多項式  .中國知網[引用日期2017-10-21]