複製鏈接
請複製以下鏈接發送給好友

互信息

鎖定
互信息(Mutual Information)是信息論裏一種有用的信息度量,它可以看成是一個隨機變量中包含的關於另一個隨機變量的信息量,或者説是一個隨機變量由於已知另一個隨機變量而減少的不肯定性 [1] 
中文名
互信息
外文名
Mutual Information
所屬學科
信息論
所屬學科
統計學
機器學習
定    義
信息論裏一種有用的信息度量

互信息定義

設兩個隨機變量
的聯合分佈為
,邊緣分佈分別為
,互信息
是聯合分佈
與邊緣分佈
的相對熵, [2] 
H(X),H(Y),I(X,Y)等關係圖 H(X),H(Y),I(X,Y)等關係圖

互信息性質

互信息互信息性質

對任意隨機變量
,其互信息
滿足:
  1. 對稱性:
  2. 半正定:
    ,當且僅當
    獨立,
平均互信息量不是從兩個具體消息出發, 而是從隨機變量X和Y的整體角度出發, 並在平均意義上觀察問題, 所以平均互信息量不會出現負值。或者説從一個事件提取關於另一個事件的信息, 最壞的情況是0, 不會由於知道了一個事件,反而使另一個事件的不確定度增加。

互信息鏈法則

互信息不等式

如果
構成馬式鏈,則
其他
某個詞t和某個類別Ci傳統的互信息定義如下:
互信息是計算語言學模型分析的常用方法,它度量兩個對象之間的相互性。在過濾問題中用於度量特徵對於主題的區分度。互信息的定義與交叉熵近似 [2]  。互信息本來是信息論中的一個概念,用於表示信息之間的關係, 是兩個隨機變量統計相關性的測度,使用互信息理論進行特徵抽取是基於如下假設:在某個特定類別出現頻率高,但在其他類別出現頻率比較低的詞條與該類的互信息比較大。通常用互信息作為特徵詞和類別之間的測度,如果特徵詞屬於該類的話,它們的互信息量最大。由於該方法不需要對特徵詞和類別之間關係的性質作任何假設,因此非常適合於文本分類的特徵和類別的配準工作 [2] 

互信息含義

互信息與多元對數似然比檢驗以及皮爾森
校驗有着密切的聯繫 [3] 

互信息信息的含義

信息是物質、能量、信息及其屬性的標示。逆維納信息定義
信息是確定性的增加。逆香農信息定義
信息是事物現象及其屬性標識的集合。

互信息互信息的含義

信息論中的互信息
一般而言,信道中總是存在着噪聲和干擾,信源發出消息x,通過信道後信宿只可能收到由於干擾作用引起的某種變形的y。信宿收到y後推測信源發出x的概率,這一過程可由後驗概率p(x|y)來描述。相應地,信源發出x的概率p(x)稱為先驗概率。我們定義x的後驗概率與先驗概率比值的對數為y對x的互信息量(簡稱互信息) [4] 
根據熵的連鎖規則,有
因此,
這個差叫做X和Y的互信息,記作I(X;Y)。
按照熵的定義展開可以得到:
參考資料
  • 1.    劉青芳. 基於改進互信息的醫學圖像配準方法研究[D].山西大學,2010.
  • 2.    鄧綵鳳. 中文文本分類中互信息特徵選擇方法研究[D].西南大學,2011.
  • 3.    楊立娜. 基於相位相關理論的最大互信息圖像配準[D].西安電子科技大學,2010.
  • 4.    範雪莉,馮海泓,原猛. 基於互信息的主成分分析特徵選擇算法[J]. 控制與決策,2013,28(06):915-919. [2017-08-30]. DOI:10.13195/j.cd.2013.06.117.fanxl.026