反饋

零和博弈

（社會學概念）

零和博弈（zero-sum game），又稱零和遊戲，與非零和博弈相對，是博弈論的一個概念，屬非合作博弈。它是指參與博弈的各方，在嚴格競爭下，一方的收益必然意味着另一方的損失，博弈各方的收益和損失相加總和永遠為“零”，故雙方不存在合作的可能。

中文名: 零和博弈
外文名: A zero-sum game
別名: 零和遊戲

創立時間: 20世紀
學科: 社會心理學
原理來源: 博弈論

零和博弈主要特點

零和博弈的結果是一方獲利而另一方損失，且一方的所得正是另一方的所失，整個社會的利益並不會因此而增加一分。也可以説：在零和博弈中，自己的幸福是建立在他人的痛苦之上的，二者的大小完全相等，因而雙方都想盡一切辦法以實現“損人利己”。

零和博弈又被稱為遊戲理論或零和博弈，源於博弈論（game theory）。早在2000多年前，這種零和博弈就廣泛用於有贏家必有輸家的競爭與對抗。“零和遊戲規則”越來越受到重視，因為人類社會中有許多與“零和遊戲”相類似的局面。與“零和”對應，“雙贏”的基本理論就是既“利己”又不“損人”，能夠通過談判、合作達到皆大歡喜的結果。

零和博弈博弈模型

零和博弈的原理如下：兩人進行博弈，每次博弈後都會有一個人贏，一個人輸。每次博弈後，我們計贏家得1分，而輸家得-1分。假設A、B兩人進行多次博弈，設A獲勝次數為N次，並且失敗次數為M次，由於是零和博弈，故B失敗次數必然為N次，獲勝的次數必然為M次。這樣，經過M+N次博弈後，A的總分為（N-M），B的總分為（M-N），從而A和B的總分為（N-M）+（M-N）=0，這就是零和博弈的數學表達式。^[1]

在某個零和博弈中，假設玩家A和B都有兩個共同選擇{選擇1，選擇2}，規定若兩個玩家都做出相同的選擇，則玩家A得-1分，玩家B得1分；若兩個玩家都做出不同的選擇，則玩家A得1分，玩家B得-1分。收益矩陣如下：

博弈模型收益矩陣
	選擇1	選擇2
選擇1	-1，1	1，-1
選擇2	1，-1	-1，1

零和博弈理論背景

零和博弈源於博弈論，現代博弈理論由匈牙利大數學家馮·諾伊曼於20世紀20年代開始創立，1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的鉅著《博弈論與經濟行為》，標誌着現代系統博弈理論的初步形成。

零和博弈之所以廣受關注，主要是因為人們發現社會的方方面面都能發現與“零和博弈”類似的局面，勝利者的光榮後往往隱藏着失敗者的辛酸和苦澀。從個人到國家，從政治到經濟，似乎無不驗證了世界正是一個巨大的零和博弈場。這種理論認為，世界是一個封閉的系統，財富、資源、機遇都是有限的，個別人、個別地區和個別國家財富的增加必然意味着對其他人、其他地區和國家的掠奪，這是一個邪惡進化論式的弱肉強食的世界。我們大肆開發利用煤炭石油資源，留給後人的便越來越少；不斷污染環境，帶給後人的不良影響便越來越多。

通過有效合作皆大歡喜的結局是可能出現的。但從零和博弈走向雙贏，要求各方面要有真誠合作的精神和勇氣，在合作中不耍小聰明，不要總想佔別人的小便宜，要遵守遊戲規則，否則雙贏的局面就不可能出現，最終吃虧的還是合作者自己。

從20世紀以來，人類在經歷了兩次世界大戰、經濟的高速增長、科技進步、全球一體化以及日益嚴重的環境污染之後，“零和博弈”觀念正逐漸被“雙贏”觀念所取代。在競爭的社會中，人們開始認識到“利己”不一定要建立在“損人”的基礎上。領導者要善於跳出“零和”的圈子，尋找能夠實現“雙贏”的機遇和突破口，防止負面影響抵消正面成績。批評下屬如何才能做到使其接受而不牴觸，發展經濟如何才能做到不損害環境，開展競爭如何使自己勝出而不讓對方受到傷害，這些都是每一個為官者應該仔細思考的問題。有效合作，得到的是皆大歡喜的結局。從零和走向正和，要求各方要有真誠合作的精神和勇氣，遵守遊戲規則，否則“雙贏”的局面就不會出現，最終吃虧的還是合作者自己。

零和博弈主要意義

對於非合作、純競爭型博弈，約翰·馮·諾依曼所解決的只有二人零和博弈：好比兩個人下棋、或是打乒乓球，一個人贏一着則另一個人必輸一着，淨獲利為零。

在這裏抽象化後的博弈問題是，已知參與者集合（兩方），策略集合（所有棋着），和盈利集合（贏子輸子），能否且如何找到一個理論上的“解”或“平衡“，也就是對參與雙方來説都最”合理“、最優的具體策略？怎樣才是合理？應用傳統決策論中的“最小最大”準則，即博弈的每一方都假設對方的所有策略的根本目的是使自己最大程度地失利，並據此最優化自己的對策，諾伊曼從數學上證明，通過一定的線性運算，對於每一個二人零和博弈，都能夠找到一個“最小最大解”。通過一定的線性運算，競爭雙方以概率分佈的形式隨機使用某套最優策略中的各個步驟，就可以最終達到彼此盈利最大且相當。當然，其隱含的意義在於，這套最優策略並不依賴於對手在博弈中的操作。用通俗的話説，這個著名的最小最大定理所體現的基本“理性”思想是“抱最好的希望，做最壞的打算”。

雖然零和博弈理論的解決具有重大的意義，但作為一個理論來説，它應用於實踐的範圍是有限的。零和博弈主要的侷限性有二，一是在各種社會活動中，常常有多方參與而不是隻有兩方；二是參與各方相互作用的結果並不一定有人得利就有人失利，整個羣體可能具有大於零或小於零的淨獲利。對於後者，歷史上最經典的案例就是“囚徒困境”。在“囚徒困境”的問題中，參與者仍是兩名（兩個盜竊犯），但這不再是一個零和的博弈，因為其中一個人的損失並不等於另一個人的收益。（刪除：兩個小偷可能一共被判16年，或一共只被判2年。）

零和博弈理論內涵及具體案例

在零和博弈中所有的參與者其獲利與虧損的和正好等於零。贏家的利潤來自於輸家的虧損。以下有一些重要的觀念是你在瞭解該交易是否為零和博弈所必須先知道的。這個分類決定於我們對玩家利潤與虧損的定義有多寬廣。它本身的分類對我們並不重要，但是對發起人就很重要了。要介紹這觀念的發展，我們先討論撲克遊戲，然後我們再切入操作，因為撲克相對於操作是一種很好的比喻。

零和博弈撲克

撲克是一種零和博弈

撲克在朋友之間、在撲克俱樂部、或是錦標賽都可以玩，我們來探討這些遊戲之間的異同。一般來説朋友之間玩撲克是一種典型的零和博弈。無論哪一個人贏，就會有其它的人輸，這之間的輸贏總和是零。

撲克俱樂部裏面玩的就不太一樣了，因為俱樂部對賭注總額會收取一個固定比率的費用，比方説是1%，則這將形成負和博弈。也就是輸贏的總和小於零（如果加上俱樂部的抽成就為零了），玩家們集合虧損給俱樂部。如果我們定義俱樂部也是這個賭局特殊型態玩家的話，這個賭局又變成了零和博弈。換句話説，我們計算贏家所贏的和輸家所輸的扣除俱樂部抽成的總和，那又變成一個零和博弈了，扣除了付俱樂部的抽成之後，不管是誰贏，其它人就是輸家。

錦標賽中的撲克賭局是由贊助商提供獎品，因此它是一個正和博弈（如果它的獎金超過所有參賽者的報名費的話），若我們計算總獎項的淨值，那麼撲克仍然是一個零和博弈。扣除了獎項之後，無論是誰贏，其它人都是輸。

無論在什麼場合玩撲克，這種賭局根本上的特性都存在，它就是一個零和博弈（假設這是一個基準），以這個觀點看來，上述三種型態都是相同的，玩家們經常不關心它的基準為何，而持續玩相同的策略。

人們玩撲克要依靠這個基準的理由，撇開技術的差異性，那就是在錦標賽中大部分的玩家是贏家，而俱樂部中大部分的玩家是輸家。

倘若除了考慮金錢，還考慮其他因素帶來的收益，那麼撲克可能是一種正和博弈

我們只憑金錢的貢獻來定義撲克賭局中的贏家和輸家。若要來解釋為什麼俱樂部中的玩家平均來説是輸，這種定義過於狹隘。

仔細考慮人們玩撲克的四個理由，前兩個理由包含外部的利益，第三個理由包含無益的及不理性的行為，第四點為預期利潤。

第一可能也是最重要的一點，許多人玩撲克的原因是因為他們單純地就是想玩（或是學着如何玩）。這些玩家願意玩，即使一開始就預期會輸，這個玩樂的外部利益可以解釋為什麼朋友之間縱使經常會輸給技術較好的人，也會經常性地聚在一起玩。當玩家從撲克中取得此種衍伸樂趣時，撲克就是一種正和博弈。

第二，有些玩家玩撲克是因為他們可能尚未學會如何玩，或是仍無法成為一個技術較好的玩家來經由撲克賺錢。這些新手玩家們可能缺乏信息或是能力有限，但是絕不會不理性。如果他們瞭解到他們無法經由玩撲克賺錢，他們就會放棄。要學習是否能由撲克當中賺錢的代價相當昂貴，這些知識是藉由玩撲克可以獲得的相當有價值的外部利益。新手玩家經常被稱為笨蛋，而“笨蛋在每一分鐘都會誕生”。然而，直到他們學習到並評價這個教訓，這些人並不是笨蛋。

第三，有些玩家無法學習，或是無法接受他們無法藉由玩撲克來賺錢。這些玩家所追求的微小利潤從來就沒有實現過，他們經常是不理性的，而且可能有點情緒化。這些玩家是真正的笨蛋，因為他們拒絕去學習他們該學的東西，或是堅持花最高昂的代價去學習一些無用的方法。

最後，有些玩家玩撲克是因為他們是真正的行家，這些具有高超技術的玩家總是贏走其他玩家們的錢。他們所贏的可以超過所需的支出，這些支出包含給俱樂部的抽成，以及他們如果做別的工作可以得到的薪水，以及要維持專業與競爭力所產生的費用。這些玩家從那些願意把錢輸給他們的技術較差的玩家手中獲利（也許是俱樂部）。這些人通稱為“郎中”，因為他們捕食較弱的玩家。較弱的玩家通常避免與郎中同局，為了避免被認出來，這些郎中總是經常變換地方來捕食。如果郎中無法尋得獵物，或由於獵物們成功地避開他們，或由於獵物們一下子就放棄了，這些郎中也很難以生存。

零和博弈交易

交易是一種零和博弈

像撲克一樣，交易的分類可以分為零和博弈、負和博弈、或是正和博弈，完全取決於我們如何定義利潤和虧損。

倘若我們只以獲利和虧損來當作基準衡量交易，那麼它必然是一個零和博弈。舉例來説，假設操作利潤和虧損被定義為與基本價值相對應（基本上它無法觀察），那麼當買方和賣方交易，他們會設定一個價格，如果這個價格高於基本價值，賣方就取得買方支出的利益。在市場上若沒有其它交易員的虧損，不會有任何一個交易員獲利的。既然我們無法確定地觀察出基本價值，亦即交易員也無法確知他們的利潤及虧損，則他們交易時間中的不確定性就不會改變零和博弈的本質。

如果所用的基準對買方和賣方是相同的，那麼用來定義利潤和虧損的基準並不影響零和博弈的本質。這個基準決定我們如何來解釋利潤和虧損。當我們用基本價值作為基準，我們解釋價格和基本價值間的不同點為基本操作利潤或虧損，不幸地，在沒有定義以及估計基本價值之前，這些利潤和虧損無法被估計。

就這個觀點而言，操作利潤和虧損的定義是以應用於買賣雙方的一般基準為基礎。一般常見的基本價值基準產生了零和博弈。一般報酬基準產生的博弈可以很容易地經由調整來成為零和博弈。不管如何，沒有其它交易員的虧損，是不會有任何交易員有所獲利的。基於這個論點，交易就是一個零和博弈。

在考慮其他因素的情況下，交易可能是一種正和博弈

理性的交易員不會去玩那種只能得到操作利潤的純零和博弈，如果所有的交易員都一樣，所有的預期報酬率都是零，就不會有人從交易中獲得利益。如果有些交易員技術較其它人好，這些技術較好的交易員願意交易，但那些技術差的不願意，那麼就沒有人交易了^[2] 。

要解釋為什麼理性的交易員要交易，首先我們要先認清有些人交易不是隻為了預期報酬。人們交易為了避險、為了將資金移轉、為了交換財產、為了賺取絕對的報酬、為了學習他們是否可以藉由操作賺錢、或是得到賭博的樂趣。這些外部利益使得交易成為一種正和博弈。如果這些交易的外部利益夠好，即使交易員自認會輸，還是會去交易。技術好的交易員就可從這些技術較差，但是基於外部利益而進場交易的交易員手中來獲利。

市場價格有效地整合信息，而技術較好的交易員根據他們獲得的信息來交易以獲取利潤。如果操作利潤超過獲得信息的成本，這種行為具有獲利性。如果沒有人基於外部利益而進場交易，技術好的交易員就無法藉由交易來獲利。他們將會放棄他們的研究，進而放棄交易，則價格的效率性將不復見。價格效率是依據技術好的交易員與那些願意交易或是不理性的輸家所創造的，技術好的交易員使得價格產生效率，而那些輸家就對他們研究的努力而付費。

零和博弈範例

有兩個玩家進行博弈遊戲，玩家一可以選擇策略A或策略B，玩家二可以選擇策略C、策略D和策略E中的一個。玩家的最終選擇決定他們的收益大小，收益矩陣如下：

收益矩陣
	C	D	E
A	20,-20	-10,10	30,-30
B	-20,20	20,-20	10,-10

例如，當玩家一選擇策略A，玩家二選擇策略D時，玩家一失去10分，玩家二得到10分。

無論玩家一選擇策略A或者B，對玩家二而言，選擇策略C總是比選擇策略E的收益要高，所以玩家二永遠都不會選擇策略E。因此，我們可以視玩家二的策略集為{C，D}。

納什均衡：設玩家一選擇策略A的概率為p，玩家二選擇策略C的概率為q。

設玩家一和玩家二的收益分別為u1和u2，則

	玩家一（選擇策略A）	玩家二（選擇策略C）
概率	p	q
收益	u1	u2
計算過程	u1=20pq-20(1-p)q-10p(1-q)+20(1-p)(1-q)	u2=-20pq+20(1-p)q+10p(1-q)-20(1-p)(1-q)
計算過程	令∂u1/∂p=0和∂u2/∂q=0
答案	p=4/7	q=3/7

因此，該博弈的混合策略納什均衡：玩家一以4/7概率選擇策略A，以3/7概率選擇策略B；玩家二以3/7概率選擇策略C，以4/7概率選擇策略D，以0概率選擇策略E。

零和博弈有關應用

零和博弈金融市場

零和博弈是博弈過程的最基本模型。理想的零和博弈對於金融市場有重要意義。

在金融市場實際趨勢運行中，理想零和博弈的全過程接近於一個半圓。當然，所謂半圓，與觀察者制定座標的數值單位有關，如果大幅壓縮時間單位，這個半圓看起來就像拋物線；如果大幅擴展時間單位，路線又象一段扁扁的圓弧。因此，在上面表達最高點的時候，提出“公認的相關係數”概念。在這個相關係數引導下，最高點就是一個明確的數值，也就排除了觀察座標繪製過程的伸縮帶來的影響。

理想零和博弈，從金融趨勢的演變角度來看，最終將構成核心因子。混沌經濟學研究者一直希望在證券市場尋找到主宰世界命運的“混沌因子”，事實上，所有金融市場的“混沌因子”就是這麼一個理想零和博弈的半圓。而最終，一個半圓的小泡影，也將幻化出五光十色的大千世界，其壽命成千上萬年，或者更長。這個小泡影，帶有“真善美”的天然屬性。^[3]

零和博弈公司治理

公司治理中的零和博弈並非沒有一個均衡點，可以從對手之間的博弈轉變為正當管理與不正當管理之間的此消彼長，由此避免雙方的對抗。正當管理與不正當管理的零和博弈中，正當管理的成份多一點，不正當管理的成份就少一點，反過來也是一樣，兩者之間存在着零和關係。管理者的精力是有限的，當他把精力過多的用在不正當管理的歪門邪道上時，就會嚴重影響到正當管理的艱苦卓絕的努力。因此，通過反對不正當管理來完成公司治理的任務，從而促進正當管理，對於把企業蛋糕做得更大，是不可或缺的。

首先，它可以避免所有者和其他相關利益者一方在零和博弈中處於必輸的地位。在零和博弈中，管理者一方在信息不對稱中處於優勢地位，再加上其實際控制着人流、物流、資金流，因而在內部博弈中總是穩操勝券。作為對手的所有人和其他相關利益者一方，要想改變這種被動局面，通過公司治理加以抗衡總是必要的。其次，為反對不正當管理而付出一定成本是合算的。通過建立健全公司治理機制，反對不正當管理，難免要付出一定的成本，但它肯定是在可以承受的範圍之內，與在零和博弈中必輸的份額相比，與企業資產可能被掏空相比，付出這種成本還是合算的。再次，付出的必要成本使得企業“蛋糕做得更大”更有希望。反對不正當管理至少可以使管理者在內部“零和博弈”中獲利的行為得到遏制，通過這種有效的工作使管理者在內部零和博弈中失去優勢之後，就有望促使其將自己的聰明才智用在把“蛋糕做得更大”上，因為那樣同樣可以使他們個人所得的絕對數額更多。

從博弈論的研究來看，解決零和博弈問題的出路在於參與博弈者從零和走向雙贏或者多贏，但是其前提必須擺脱零和博弈的思維定勢。在企業管理中也是一樣，兩權分離的公司制發展軌跡不可逆轉，而內部零和博弈又會產生內耗，解決的辦法與其寄希望於大家在“零和博弈”中握手言和，不如讓經營管理者感到實施不正當管理得不償失，知難而退，一致對外，把企業利益的蛋糕做得更大。 ^[1]

零和博弈博弈遊戲

人與機器最大的不同就是，人有感情，所以人會犯錯誤。而這正是傳統的博弈理論所忽視的。傳統博弈理論用數學方法追求博弈格局中的最優策略，但前提是雙方都不會犯錯。所以，簡單地把博弈理論運用到商戰實踐中，往往會出問題。但我們博弈的棋牌博弈就不一樣，關鍵並非走出“最優的棋招”，而是走出“最有可能擊敗對手的棋招”。

參考資料

1. 佚名. 博弈的哲學[M]. 中山大學出版社, 2014.
2. 杜振鵬. 哈佛博弈課[M]. 企業管理出版社, 2014.
3. 艾瑞卡·S.奧爾森. 零和博弈[M]. 中國財政經濟出版社, 2014.

零和博弈的概述圖（2張）

詞條統計

瀏覽次數：次
編輯次數：68次歷史版本
最近更新： fastwalk （2023-09-25）

1 主要特點
2 博弈模型
3 理論背景
4 主要意義
5 理論內涵及具體案例: 5.1 撲克; 5.2 交易; 5.3 範例
6 有關應用: 6.1 金融市場; 6.2 公司治理; 6.3 博弈遊戲