-
核密度估計
鎖定
- 中文名
- 核密度估計
- 外文名
- kernel density estimation
- 別 名
- Parzen窗
- 提出者
- Rosenblatt 、Emanuel Parzen
- 性 質
- 非參數檢驗方法之一
- 適用範圍
- 概率論
目錄
- 1 簡介
- 2 一些比較常用的核函數
核密度估計簡介
核密度估計在估計邊界區域的時候會出現邊界效應。
由給定樣本點集合求解隨機變量的分佈密度函數問題是概率統計學的基本問題之一。解決這一問題的方法包括參數估計和非參數估計。參數估計又可分為參數迴歸分析和參數判別分析。在參數迴歸分析中,人們假定數據分佈符合某種特定的性態,如線性、可化線性或指數性態等,然後在目標函數族中尋找特定的解,即確定迴歸模型中的未知參數。在參數判別分析中,人們需要假定作為判別依據的、隨機取值的數據樣本在各個可能的類別中都服從特定的分佈。經驗和理論説明,參數模型的這種基本假定與實際的物理模型之間常常存在較大的差距,這些方法並非總能取得令人滿意的結果。由於上述缺陷,Rosenblatt和Parzen提出了非參數估計方法,即核密度估計方法。
由於核密度估計方法不利用有關數據分佈的先驗知識,對數據分佈不附加任何假定,是一種從數據樣本本身出發研究數據分佈特徵的方法,因而,在統計學理論和應用領域均受到高度的重視。
核密度估計一些比較常用的核函數
均勻核函數 k(x)=1/2,-1≤x≤1 加入帶寬h後: kh(x)=1/(2h),-h≤x≤h
三角核函數 k(x)=1-|x|,-1≤x≤1 加入帶寬h後: kh(x)=(h-|x|)/h2,-h≤x≤h
伽馬核函數 kxi(x)=(xα-1e-xα/xi)/[(xi/α)α.Γ(α)]
高斯核函數K(x,xc)=exp[-||x-xc||2/(2*σ)2],其中xc為核函數中心,σ為函數的寬度參數。
[1]