反饋

過適

過適，在統計學中，過適現象是指在調適一個統計模型時，使用過多參數。

中文名: 過適
外文名: Overfitting

學科: 統計學
方法: 調適一個統計模型

過適簡介

在統計學中，過擬合（英語：overfitting，或稱過度擬合）現象是指在擬合一個統計模型時，使用過多參數。

對比於可獲取的數據總量來説，一個荒謬的模型只要足夠複雜，是可以完美地適應數據。過擬合一般可以視為違反奧卡姆剃刀原則。

當可選擇的參數的自由度超過數據所包含信息內容時，這會導致最後（擬合後）模型使用任意的參數，這會減少或破壞模型一般化的能力更甚於適應數據。過擬合的可能性不只取決於參數個數和數據，也跟模型架構與數據的一致性有關。此外對比於數據中預期的噪聲或錯誤數量，跟模型錯誤的數量也有關。

過擬合現象的觀念對機器學習也是很重要的。通常一個學習算法是藉由訓練示例來訓練的。亦即預期結果的示例是可知的。而學習者則被認為須達到可以預測出其它示例的正確的結果，因此，應適用於一般化的情況而非只是訓練時所使用的現有數據（根據它的歸納偏向）。然而，學習者卻會去適應訓練數據中太特化但又隨機的特徵，特別是在當學習過程太久或示例太少時。在過擬合的過程中，當預測訓練示例結果的表現增加時，應用在未知數據的表現則變更差。

在統計和機器學習中，為了避免過擬合現象，須要使用額外的技巧（如交叉驗證、提早停止、貝斯信息量準則、赤池信息量準則或模型比較），以指出何時會有更多訓練而沒有導致更好的一般化。人工神經網上的過擬合過程亦被認知為過度訓練（英語：overtraining）。在treatmeant learning中，使用最小最佳支持值（英語：minimum best support value）來避免過擬合。

相對於過擬合是指，使用過多參數，以致太適應數據而非一般情況，另一種常見的現象是使用太少參數，以致於不適應數據，這則稱為乏適（英語：underfitting，或稱：擬合不足）現象。^[1]

過適參見

數據疏通

參考資料

1. Tetko, I.V.; Livingstone, D.J.; Luik, A.I. Neural network studies. 1. Comparison of Overfitting and Overtraining, J. Chem. Inf. Comput. Sci., 1995, 35, 826-833

過適的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：10次歷史版本
最近更新：一碗加糖饭（2024-05-21）

1 簡介
2 參見

過適

目錄

過適簡介

過適參見