-
相關指數
鎖定
- 中文名
- 相關係數
- 外文名
- Correlation coefficient
- 拼 音
- Xiāng guān xìshù
- 學 科
- 數學
- 別 名
- 判定係數
- 應 用
- 迴歸分析
相關指數基礎知識
相關:事物之間存在關係,但又不能直接做因果關係解釋時,稱事物間的聯繫為相關。
判斷兩個因素或變量之間是否有關係,定量地研究這些關係,稱為相關分析。
按性質不同,相關可以劃分為:正相關、負相關、零相關。
正相關:兩個變量向相同的方向變化。即一個變量的值增加,另一個變量得值也增加。
負相關:兩個變量向相反的方向變化。即一個變量的值增加,另一個變量的值相應地減少。
零相關:兩列變量之間沒有關係,即一列變量變動時,另一列變量作無規律變動。
相關係數是一種描述性統計量,它指的是一個變量與另一個變量的變化的對應程度。符號:總體相關係數ρ;樣本相關係數r。
直線迴歸:當一變量隨另一變量有規律變化時,它們之間依存變化的數量關係稱直線迴歸。
直線迴歸分析:據實測值建立一個迴歸方程,來定量表達兩變量間數量依存變化關係的方法和過程。
決定係數表示的是兩個變量之間共同方差的比例。用符號表示:
。例如:如果兩個變量之間的相關係數r=0.82,那麼
=0.67,我們就可以得出結論説,由於兩個變量間的線性關係,Y變量的67%的變異可以有X變量中的變異來預測和解釋。
相關指數計算公式
總體平方和(Total Sum of Squares):
。
殘差平方和(Residual Sum of Squares ):
。
三者關係:TSS=ESS+RSS。
Y的觀測值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來自迴歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變,如果實際觀測點離樣本回歸線越近,則ESS在TSS中佔的比重越大,因此定義擬合優度:迴歸平方和ESS與Y的總離差TSS的比值。即
。
我們可以用
來刻畫迴歸的效果。對於已經獲取的樣本數據,R2表達式中的
為確定的數。因此R2越大,意味着殘差平方和
越小,即模型的擬合效果越好;R2越小,殘差平方和越大,即模型的擬合效果越差。在線性迴歸模型中,R2表示解釋變量對於預報變量變化的貢獻率。R2越接近於1,表示迴歸的效果越好
[3]
。
相關指數注意事項
問題
1.盲目的崇拜論文中展示或計算機計算出估計結果;
2.過度依賴方程總體擬合度在評價迴歸模型不同設定之間優劣時的作用;
3.判斷係數的大小依賴於解釋變量的個數,從而造成其在評價方程總體擬合度時出現偏誤。
相應的處理方法
1.在承認迴歸結果以前,要從模型所隱含的理論到數據的質量,認真考察和評估所估計方程的每一個方面;
2.綜合運用各種統計檢驗和計量檢驗;
相關指數舉例
例:一個車間為了規定工時定額,需要確定加工零件所花費的時間,為此進行了 10 次試驗,測得數據如下:
零件個數(x)個 | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | 100 |
加工時間(y)分 | 62 | 68 | 75 | 81 | 89 | 95 | 102 | 108 | 115 | 122 |
已知迴歸方程為:
,求出相關指數
,進行迴歸性分析。