反饋

斯塔克爾貝格對策

斯塔克爾貝格對策，又稱為主從對策。它是在多級遞階決策系統中，由於決策人所處的地位不同，所形成的一種新的對策形式。由經濟學家斯塔克爾貝格提出。社會現象的結局通常是由許多決策人的行動共同決定的。而這些決策人分居不同層次，形成所謂多級遞階的決策系統。上層決策人具有一定權威，起着主導作用，有時代表全局的利益。他們對整個系統的控制可以通過操縱一些“槓桿”變量來影響下級的行為而實現。

中文名: 斯塔克爾貝格對策
外文名: Stackelbergcountermeasures
別名: 主從對策

提出者: 斯塔克爾貝格
學科: 運籌學
隸屬: 衝突分析方法

斯塔克爾貝格對策基本內容

衝突：一般來説，兩個或兩個以上的組織間存在爭論，這種情況稱為衝突。

衝突分析：是在經典對策論和偏對策理論基礎上發展起來的一種對沖突行為進行正規分析(Formal Analysis)的決策分析方法，它運用數學模型來描述衝突現象，提取衝突過程的本質和特點，分析各種可能和必然的衝突結果，並決策者提供有力的決策依據。

衝突分析的目的在於協調衝突中各參與者之間的矛盾，提出最終權宜解決方案。這是一種着眼於解決現實社會爭端的一種特別的遊戲理論，屬於一般博弈理論的一個分支。

衝突分析的主要特點是能最大限度地利用信息，通過對許多難以定量描述的現實問題的邏輯分析，進行衝突事態的結果預測和過程分析（預測和評估、事前分析和事後分析），幫助決策者科學周密地思考問題。它是分析多人決策和解決多人競爭問題的有效工具之一。

衝突分析的要素(也叫衝突事件的要素)是使現實衝突問題模型化、分析正規化所需的基本信息，也是對原始資料處理的結果。主要有：

（1）時間點：是説明“衝突”開始發生時刻的標誌；對於建模而言，則是能夠得到有用信息的終點。因為衝突總是一個動態的過程，各種要素都在變化，這樣很容易使人認識不清，所以需要確定一個瞬間時刻，使問題明朗化。但時間點不直接進入分析模型。

（2）局中人（Players）：是指參與衝突的集團或個人(利益主體)，他們必須有部分或完全的獨立決策權(行為主體)。衝突分析要求局中人至少有兩個或兩個以上。局中人集合記作N。

（3）選擇或行動(Options)：是各局中人在衝突事態中可能採取的行為動作。衝突局勢正是由各方局中人各自採取某些行動而形成的。每個局中人一組行動的某種組合稱為該局中人的一個策略。

（4）結局(Outcomes)：各局中人衝突策略的組合共同形成衝突事態的結局。全體策略的組合(笛卡爾乘積或直積)為基本結局集合，結局是衝突分析問題的解。

（5）優先序或優先向量（Preference Vector）：各局中人按照自己的目標要求及好惡標準，對可能出現的結局（可行結局）排出優劣次序，形成各自的優先序（向量）^[1] 。

斯塔克爾貝格對策發展歷程

早在1952年，英國經濟學家H．Von Stackelberg在研究靜態經濟競爭時就提出了斯塔克爾貝格對策形成的原始模型。但直到Chen和Cruz研究了兩人動態非零和主從對策，Simaan和Cruz研究了兩羣局中人的情形才使人們轉入到對它的研究上來。後來，Castanon等人將主從對策推廣到了隨機對策，相繼提出了開環策略、反饋策略、閉環策略等概念，並初步考慮了非嵌套信息結構以及多層主從對策結構。20世紀70年代末。Basar提出了設計 “隊優”(team-optima1)策略的間接法，考慮將主、從雙方的決策變量聯繫起來，為研究提供新途徑，隊優策略則逐步發展成為以後的誘導策略。進入20世紀90年代，主從對策的求解和算法廣泛引起了關注^[2] 。

斯塔克爾貝格對策分類

靜態Stackelberg對策

靜態問題可描述如下：局中人由主方(Leader)和從方(Follower)兩方組成，其目的要極小化各自的費用函數。

費用函數：

。

動態Stackelberg對策

動態Stackelberg對策可分為離散時間和連續時間兩種情形。離散時間Stackelberg對策描述如下：

狀態方程為：

。

費用函數為：

；

。

其中，

，

是給定的初始值，

，

。

鼓勵性策略

當主方佔有絕對的有利地位，它可以追求理想的境界

，從而產生了鼓勵或威脅的手法，把人們從艱難的直接求解中解脱出來，轉向間接求解^[1] 。

斯塔克爾貝格對策比較

斯塔克爾貝格對策：基本問題是對策中的主方如何利用自己的領導地位制訂決策或策略，以引導從方採取合作行為，它與經濟學中有關機制設計的研究有密切聯繫，兩者都是研究如何設計適當的激勵機制或誘導策略用以揭示從方的私有信息、誘導從方的利己行為有益於全局的利益。這種模型較好地反映了社會、經濟和管理系統中的層次結構，近年來吸引了眾多的學者進行研究。

誤對策：又稱超對策，是20世紀70年代由西方學者提出的。該方法假設：各局中人因對其他局中人的偏好順序判斷有誤、對其他局中人的可用策略錯誤理解等等，而對決策形勢產生了偏差。一個誤對策的均衡點是由對策表中主對角線上各偏好順序向量而確定的。誤對策分析主要有一階誤對策

和二階誤對策

。一階誤對策是指至少有一個局中人的感知產生誤差而所有局中人都沒有意識到。二階誤對策是指至少有一個局中人意識到有某個局中人的感知存在誤差。K階誤對策

的概念可以此類推。

軟對策: Nigel Howard於1990年提出了軟對策論。其前提條件更接近客觀實際，在原有理性選擇模型中，偏好或者被預先設定並保持不變，或者過分強調偏好的動態特性，而軟對策既研究偏好固定時的情形，又研究其動態演變過程，使衝突中的靜、動態特性得到了有機統一。軟對策理論對傳統理論進行了改進，如將傳統的方案分析法擴展為對抗分析法，並創新性地對一些假定進行了修正，引入了許多局中人之間相互影響的新因素：非理性、情緒與不信任等。 1993年Bennett和Howard又提出了戲劇模型，對軟對策理論有了進一步發展^[2] 。

斯塔克爾貝格對策應用

對策起源於經濟，它有着豐實的經濟學背景和樂觀的應用前景。嚴格説來對策與決策是有本質區別的，對策是指人與人之間的關係，決策則指人與自然的關係。而在經濟學中這些問題往往又相互交織在一起，形成多級決策系統。

其中，用國家調節利率、税收、投資等決策量來控制各部門各單位的行為而實現全局最優，企業通過分配、獎勵等手段來引導職工採取合作行為以提高整體的效益，都屬於斯塔克爾貝格對策。例如，用一個三人對策模型(一箇中央政府，兩個地方政府)用來描述我國過去的財政包乾制度，考慮兩種不同的Stackelberg對策，第一種情況是中央政府先行動，地方政府後行動；第二種情況是，地方政府先行動，中央政府後行動。第一種情況對應於中央政府能夠信守事先簽訂的税收分享合同的情況，第二種情況對應於中央政府不能信守合同的行動，並就理論研究結果給出了建設性的意見。

斯塔克爾貝格對策也廣泛應用於物流供應鏈訂貨問題的求解對策上。例如，給出了一個一般Stackelberg對策問題模型及其解計算的遺傳算法求解步驟，在一類單分銷商、多顧客單產品供應鏈中，針對訂貨的Stackelberg對策中分銷商的最小補充期協調問題，建立顧客成本合理性約束下的分銷商成本優化模型，並以分銷系統為對象進行了Stackelberg對策的仿真實驗。結果表明，通過供應鏈中最小補充期協調，整個供應鏈及其成員都可從中受益，供應鏈訂貨的Stackelberg對策的分散協調機制有效地實現了供應鏈協調^[3] 。

參考資料

1. 教材編寫組．運籌學．北京：清華大學出版社，2012.
2. 劉知貴,黃正良. Stackelberg對策綜述[J]. 西南工學院學報,1999,(02):6-13.
3. 常良峯,黃小原,胡建忠. 一類供應鏈訂貨的Stackelberg主從對策[J]. 東北大學學報,2003,(02):174-177.

斯塔克爾貝格對策的概述圖（2張）

詞條統計

瀏覽次數：次
編輯次數：10次歷史版本
最近更新： smile路过倾城（2022-03-30）

1 基本內容
2 發展歷程
3 分類
4 比較
5 應用