複製鏈接
請複製以下鏈接發送給好友

不完全信息博弈

鎖定
參與人的集合,行動順序,可以採取什麼行動,當參與人行動時他們知道什麼,以及參與人的收益函數,當這些都是參與人的共同知識時,博弈被稱為是完全信息的。在不完全信息(incomplete information)博弈中,至少有一名參與者對於以上內容不完全瞭解,例如不清楚其他人的收益函數。此時為了求解博弈,我們往往需要海薩尼轉換使得不完全信息變為不完美信息的情形。
中文名
不完全信息博弈
外文名
Incomplete information game

不完全信息博弈簡介

不完全信息意味着參與人在進行博弈時不清楚博弈中的某些要素,例如在橋牌中玩家並不清楚其他玩家手中的牌,拍賣中競拍人並不清楚其他競拍人對物品的估價。與之相反,圍棋可看作完全信息博弈,因為雙方完全清楚遊戲規則,當前局面對方可能的下法等信息。下面給出一個簡單的不完全信息博弈的例子 [1] 
考慮兩家企業的行業競爭,假定這個行業已經有一個在位者(企業1)和一個潛在的進入者(企業2),企業1需要決定是否建立一個新工廠,企業2需要決定是否進入該行業。但是企業2不知道企業1建立新工廠的成本是1.5還是3,但企業1自己知道。於是此博弈的收益如下所示:
企業1建廠成本高時的收益
企業1╲企業2
進入
不進入
建廠
0,-1
2,0
不建廠
2,1
3,0
企業1建廠成本低時的收益
企業1╲企業2
進入
不進入
建廠
1.5,-1
3.5,0
不建廠
2,1
3,0
分析上述博弈,對企業1來説,若企業1建廠成本高,那麼不建廠是嚴格優勢策略,選擇不建廠即可;若企業1建廠成本低,則沒有嚴格優勢策略,需要考慮企業2的策略;對企業2來説,選擇不進入就會獲得固定的0收益,選擇進入則收益取決於企業1是否建廠。顯然若企業2知道企業1建廠成本高還是低,博弈就變為了一個簡單的靜態博弈,此處博弈分析的複雜性正是不完全信息造成的。

不完全信息博弈海薩尼轉換

為了建模博弈中存在的不完全信息,可以不妨設企業2估計企業1建廠成本高的概率為p1,建廠成本低的概率為1-p1。但計算收益時還需要知道企業1的策略,為此企業1必須估計企業2認為企業1建廠成本高的概率為p2,企業2認為企業1建廠成本低的概率為1-p2。依次類推,企業2還需考慮企業1如何估計企業2對企業1建廠成本的高的概率,這樣從某一初始推斷出發而形成了越來越高階的關於推斷的推斷問題,被稱海薩尼稱為“遞階期望”,而海薩尼通過將某一先驗分佈設為公共知識來解決這一問題。
海薩尼轉換(Harsanyi transformation)是處理不完全信息博弈的標準方法,這一方法的核心是:引入第三方“自然”首先行動,按照某一概率分佈指定博弈中不完全的信息,且這一概率分佈為公共知識。例如上述例子中就可以假定企業1以概率p建廠需要高成本,以概率1-p建廠需要低成本,也即將博弈轉換為下面的形式:

不完全信息博弈貝葉斯均衡

在進行了海薩尼轉換後,就可對博弈進行求解。在上面的例子中,博弈的參與人只同時決策一次,故為不完全信息的靜態博弈;博弈中的不完全信息實際上是玩家1的收益函數,也即玩家1的私人信息(private information),故可以用玩家1的類型(type)代表這一點,將博弈轉化為貝葉斯博弈(Bayesian game)。關於貝葉斯博弈的詳細定義此處略去,與之對應的均衡為貝葉斯均衡(Bayesian Nash equilibrium),它是納什均衡在不完全信息下的自然擴展,可以認為是在給定了“自然”選擇所有參與人類型的概率分佈後的納什均衡。
在上面行業競爭的例子中,設企業1在建廠成本低時建廠的概率為x(在建廠成本高時企業1一定不會建廠),企業2進入市場的概率為y,那麼策略組合就可以用二元組(x,y)表示。企業2的收益可以表示為:
故企業2的最優反應為:
,如果
,如果
,如果
類似的,建廠低成本的企業1的收益可以表示為:
故建廠低成本的企業1的最優反應為:
,如果
,如果
,如果
要求此博弈的貝葉斯均衡,就是求這樣的策略組合(x,y),使得x是企業1的最優反應,同時y是給定p下企業2的最優反應。故我們可以求出以下3個均衡:
  1. 對於任意的p,(x=0,y=1)是一個純策略貝葉斯均衡;
  2. 對於
    ,(x=1,y=0)是一個純策略貝葉斯均衡;
  3. 對於任意的
    是一個混合策略貝葉斯均衡。

不完全信息博弈更多例子

不完全信息博弈新產品開發博弈

兩家企業需要同時決定開發或者不開發某種成品,但是他們均不瞭解市場需求是高還是低,收益情況如下所示 [2] 
市場需求高時的收益
企業1╲企業2
開發
不開發
開發
300,300
800,0
不開發
0,800
0,0
市場需求低時的收益
企業1╲企業2
開發
不開發
開發
-400,-400
200,0
不開發
0,200
0,0
在此博弈中,不完全信息來自參與人對博弈所處狀態的不瞭解,而不是對於其他參與人類型的不瞭解。

不完全信息博弈信號博弈

信號博弈中包含兩名參與者:信號發送者和信號接收者。信號發送者首先行動,向信號接收者發送一個關於自身類型的信號,信號接收者收到信號後根據信號的內容選擇自身的行動,最終雙方的收益均由信號發送者的類型,信號發送者選擇發送的信號,與信號接收者的行動共同決定。下圖是一個簡單的信號博弈的例子:
信號博弈分為兩個依次進行的階段:信號發送者首先發送信號,信號接收者收到信號後再決定選擇何種行動,且信號接收者不知道信號發送者的類型,故信號博弈是一個不完全信息動態博弈。
參考資料
  • 1.    朱·弗登博格, 讓·梯若爾. 博弈論[M]. 中國人民大學出版社, 2010.
  • 2.    羅雲峯. 博弈論教程[M]. 第二版. 清華大學出版社, 北京交通大學出版社 2020.