複製鏈接
請複製以下鏈接發送給好友

核密度估計

鎖定
核密度估計(kernel density estimation)是在概率論中用來估計未知的密度函數,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基於數據集密度函數聚類算法提出修訂的核密度估計方法。
中文名
核密度估計
外文名
kernel density estimation
別    名
Parzen窗
提出者
Rosenblatt 、Emanuel Parzen
性    質
非參數檢驗方法之一
適用範圍
概率論

核密度估計簡介

核密度估計在估計邊界區域的時候會出現邊界效應
在單變量核密度估計的基礎上,可以建立風險價值預測模型。通過對核密度估計變異係數的加權處理,可以建立不同的風險價值的預測模型。
由給定樣本點集合求解隨機變量的分佈密度函數問題是概率統計學的基本問題之一。解決這一問題的方法包括參數估計非參數估計。參數估計又可分為參數迴歸分析和參數判別分析。在參數迴歸分析中,人們假定數據分佈符合某種特定的性態,如線性、可化線性或指數性態等,然後在目標函數族中尋找特定的解,即確定迴歸模型中的未知參數。在參數判別分析中,人們需要假定作為判別依據的、隨機取值的數據樣本在各個可能的類別中都服從特定的分佈。經驗和理論説明,參數模型的這種基本假定與實際的物理模型之間常常存在較大的差距,這些方法並非總能取得令人滿意的結果。由於上述缺陷,Rosenblatt和Parzen提出了非參數估計方法,即核密度估計方法。
由於核密度估計方法不利用有關數據分佈的先驗知識,對數據分佈不附加任何假定,是一種從數據樣本本身出發研究數據分佈特徵的方法,因而,在統計學理論和應用領域均受到高度的重視。
圖1. 圖1.

核密度估計一些比較常用的核函數

均勻核函數 k(x)=1/2,-1≤x≤1 加入帶寬h後: kh(x)=1/(2h),-h≤x≤h
三角核函數 k(x)=1-|x|,-1≤x≤1 加入帶寬h後: kh(x)=(h-|x|)/h2,-h≤x≤h
伽馬核函數 kxi(x)=(xα-1e-xα/xi)/[(xi/α)α.Γ(α)]
高斯核函數K(x,xc)=exp[-||x-xc||2/(2*σ)2],其中xc為核函數中心,σ為函數的寬度參數。 [1] 
參考資料
  • 1.    林俊、楊虎、張洪陽:核密度估計在預測風險價值中的應用 The Application of The Kernel Density Estimates in Predicting VaR,《數學的實踐與認識》2005年10期