反饋

似然函數

統計學中，似然函數是一種關於統計模型參數的函數。給定輸出x時，關於參數θ的似然函數L(θ|x)（在數值上）等於給定參數θ後變量X的概率：L(θ|x)=P(X=x|θ)。

似然函數在推斷統計學（Statistical inference）中扮演重要角色，尤其是在參數估計方法中。在教科書中，似然常常被用作“概率”的同義詞。但是在統計學中，二者有截然不同的用法。概率描述了已知參數時的隨機變量的輸出結果；似然則用來描述已知隨機變量輸出結果時，未知參數的可能取值。例如，對於“一枚正反對稱的硬幣上拋十次”這種事件，我們可以問硬幣落地時十次都是正面向上的“概率”是多少；而對於“一枚硬幣上拋十次”，我們則可以問，這枚硬幣正反面對稱的“似然”程度是多少。

中文名: 似然函數
外文名: Likelihood function
簡稱: 似然

定義: 離散型概率分佈和連續型概率分佈
應用: 最大似然估計
學科: 統計學

似然函數定義

在數理統計學中，似然函數是一種關於統計模型中的參數的函數，表示模型參數中的似然性。

給定輸出x時，關於參數θ的似然函數L(θ|x)（在數值上）等於給定參數θ後變量X的概率：

似然函數在推斷統計學（Statistical inference）中扮演重要角色，如在最大似然估計和費雪信息之中的應用等等。“似然性”與“或然性”或“概率”意思相近，都是指某種事件發生的可能性，但是在統計學中，“似然性”和“或然性”或“概率”又有明確的區分。概率用於在已知一些參數的情況下，預測接下來的觀測所得到的結果，而似然性則是用於在已知某些觀測所得到的結果時，對有關事物的性質的參數進行估計。^[1]

似然函數分佈類型

似然函數離散型概率分佈

假定一個關於參數θ、具有離散型概率分佈P的隨機變量X，則在給定X的輸出x時，參數θ的似然函數可表示為

其中，

表示X取x時的概率。上式常常寫為

或者

。需要注意的是，此處並非條件概率，因為θ不（總）是隨機變量。^[1]

似然函數連續型概率分佈

假定一個關於參數θ、具有連續概率密度函數f的隨機變量X，則在給定X的輸出x時，參數θ的似然函數可表示為

上式常常寫為

，同樣需要注意的是，此處並非條件概率密度函數。

似然函數的主要用法在於比較它相對取值，雖然這個數值本身不具備任何含義。例如，考慮一組樣本，當其輸出固定時，這組樣本的某個未知參數往往會傾向於等於某個特定值，而不是隨便的其他數，此時，似然函數是最大化的。

似然函數乘以一個正的常數之後仍然是似然函數，其取值並不需要滿足歸一化條件

似然函數的這種特性還允許我們疊加計算一組具備相同含義的參數的獨立同分布樣本的似然函數。

關於利用似然函數進行統計推斷的應用，可以參考最大似然估計（Maximum likelihood estimation）方法和似然比檢驗（Likelihood-ratio testing）方法。^[1]

似然函數對數似然函數

涉及到似然函數的許多應用中，更方便的是使用似然函數的自然對數形式，即“對數似然函數”。求解一個函數的極大化往往需要求解該函數的關於未知參數的偏導數。由於對數函數是單調遞增的，而且對數似然函數在極大化求解時較為方便，所以對數似然函數常用在最大似然估計及相關領域中。例如：求解Gamma分佈中參數的最大似然估計問題：

假定服從Gamma分佈的隨機變量

具有兩個參數

和

，考慮如下似然函數

如果想從輸出

中估計參數

，直接求解上式的極大化未免有些難度。在取對數似然函數後，

再取關於

的偏導數等於0的解，

最終獲得

的最大似然估計

當存在一組獨立同分布的樣本

時，

故而

其中，

。^[1]

似然函數參數化模型的似然函數

有時我們需要考慮在給定一組樣本輸出

時，使用待估參數

的假設值與其真實值之間的誤差，此時似然函數變成是關於待估參數

的函數。^[1]

似然函數計算實例

考慮投擲一枚硬幣的實驗。假如已知投出的硬幣正面朝上的概率是

，便可以知道投擲若干次後出現各種結果的可能性。比如説，投兩次都是正面朝上的概率是0.25：

從另一個角度上説，給定“投兩次都是正面朝上”的觀測，則硬幣正面朝上的概率為0.5的似然是

儘管這並不表示當觀測到兩次正面朝上時

的“概率”是0.25。如果考慮

，那麼似然函數的值會變大

這説明，如果參數的取值變成0.6的話，結果觀測到連續兩次正面朝上的概率要比假設0.5 時更大。也就是説，參數取成0.6 要比取成0.5 更有説服力，更為“合理”。總之，似然函數的重要性不是它的具體取值，而是當參數變化時函數到底變小還是變大。對同一個似然函數，如果存在一個參數值，使得它的函數值達到最大的話，那麼這個值就是最為“合理”的參數值。^[1]

似然函數應用

似然函數最大似然估計

最大似然估計是似然函數最初也是最自然的應用。上文已經提到，似然函數取得最大值表示相應的參數能夠使得統計模型最為合理。從這樣一個想法出發，最大似然估計的做法是：首先選取似然函數（一般是概率密度函數或概率質量函數），整理之後求最大值。實際應用中一般會取似然函數的對數作為求最大值的函數，這樣求出的最大值和直接求最大值得到的結果是相同的。似然函數的最大值不一定唯一，也不一定存在。與矩法估計比較，最大似然估計的精確度較高，信息損失較少，但計算量較大。

給定一個概率分佈D，假定其概率密度函數（連續分佈）或概率聚集函數（離散分佈）為f_D，以及一個分佈參數θ，我們可以從這個分佈中抽出一個具有n個值的採樣X₁,X₂,...,X_n，通過利用f_D，我們就能計算出其概率：

但是，我們可能不知道θ的值，儘管我們知道這些採樣數據來自於分佈D。那麼我們如何才能估計出θ呢？一個自然的想法是從這個分佈中抽出一個具有n個值的採樣X₁,X₂,...,X_n，然後用這些採樣數據來估計θ。

一旦我們獲得X₁,X₂,...,X_n，我們就能從中找到一個關於θ的估計。最大似然估計會尋找關於 θ的最可能的值（即，在所有可能的θ取值中，尋找一個值使這個採樣的“可能性”最大化）。這種方法正好同一些其他的估計方法不同，如θ的非偏估計，非偏估計未必會輸出一個最可能的值，而是會輸出一個既不高估也不低估的θ值。

要在數學上實現最大似然估計法，我們首先要定義可能性：

並且在θ的所有取值上，使這個函數最大化。這個使可能性最大的值即被稱為θ的最大似然估計。^[1]

似然函數似然比檢驗

似然比檢驗是利用似然函數來檢測某個假設（或限制）是否有效的一種檢驗。一般情況下，要檢測某個附加的參數限制是否是正確的，可以將加入附加限制條件的較複雜模型的似然函數最大值與之前的較簡單模型的似然函數最大值進行比較。如果參數限制是正確的，那麼加入這樣一個參數應當不會造成似然函數最大值的大幅變動。一般使用兩者的比例來進行比較，這個比值是卡方分配。

尼曼-皮爾森引理説明，似然比檢驗是所有具有同等顯著性差異的檢驗中最有統計效力的檢驗。

似然比檢驗是一種尋求檢驗方法的一般法則。其基本思想如下：設由n個觀察值X1，X2，…，Xn組成的隨機樣本來自密度函數為f(X; θ)的總體，其中θ為未知參數。要檢驗的無效假設是H₀： θ=θ₀，備擇假設是H1：θ≠θ_0，檢驗水準為α。為此，求似然函數在θ=θ₀處的值與在θ=θ(極大點)處的值(即極大值)之比，記作λ，可以知道：

(1) 兩似然函數值之比值λ只是樣本觀察值的函數，不包含任何未知參數。

(2) 0≤λ≤1，因為似然函數值不會為負，且λ的分母為似然函數的極大值，不會小於分子。

(3)越接近θ₀時，λ越大；反之，與θ₀相差愈大，λ愈小。因此，若能由給定的α求得顯著性界值λ₀，則可按以下規則進行統計推斷：

當λ≤λ₀，拒絕H₀，接受H₁；當λ>λ₀，不拒絕H₀，

這裏 P(λ≤λ₀)=α。(2)對於離散型的隨機變量，只需把密度函數置換成概率函數p(X;θ)，即

這一檢驗方法還可以推廣到有k個參數的情形。

但是，要確定λ的界值λ₀，必須知道當H₀成立時λ的分佈。當不了解λ的分佈或者它的分佈太複雜時，就難於確定其界值λ₀，此時可利用下述統計原理：當樣本含量n較大時，-2lnλ (本書中用符號G表示)近似x2分佈；當自由度大於1，甚至n較小時，這種近似的程度也是相當滿意的。基於上述原理，統計中廣泛應用對數似然比檢驗，通過計算統計量G，可按x2分佈處理，不但計算方便，而且只要自由度大於1，就不必考慮理論頻數大小的問題。關於似然比檢驗的具體應用，詳見條目“頻數分佈的擬合優度”、“兩樣本率比較”、“多個樣本率比較”、“樣本構成比的比較”以及“計數資料的相關分析”等。^[1]

參考資料