博弈論經(jīng)典案例：兩頭豬與囚徒困境

哈哈哈一笑 2012-08-28

展開(kāi)全文

學(xué)習(xí)管理學(xué)或經(jīng)濟(jì)學(xué)的人一定都了解一些博弈論方面的知識(shí)。在博弈論中有一個(gè)經(jīng)典案例——囚徒困境，非常耐人回味。

----“囚徒困境”說(shuō)的是兩個(gè)囚犯的故事。這兩個(gè)囚徒一起做壞事，結(jié)果被警察發(fā)現(xiàn)抓了起來(lái)，分別關(guān)在兩個(gè)獨(dú)立的不能互通信息的牢房里進(jìn)行審訊。在這種情形下，兩個(gè)囚犯都可以做出自己的選擇：或者供出他的同伙（即與警察合作，從而背叛他的同伙），或者保持沉默（也就是與他的同伙合作，而不是與警察合作）。這兩個(gè)囚犯都知道，如果他倆都能保持沉默的話(huà)，就都會(huì)被釋放，因?yàn)橹灰麄兙懿怀姓J(rèn)，警方無(wú)法給他們定罪。但警方也明白這一點(diǎn)，所以他們就給了這兩個(gè)囚犯一點(diǎn)兒刺激：如果他們中的一個(gè)人背叛，即告發(fā)他的同伙，那么他就可以被無(wú)罪釋放，同時(shí)還可以得到一筆獎(jiǎng)金。而他的同伙就會(huì)被按照最重的罪來(lái)判決，并且為了加重懲罰，還要對(duì)他施以罰款，作為對(duì)告發(fā)者的獎(jiǎng)賞。當(dāng)然，如果這兩個(gè)囚犯互相背叛的話(huà)，兩個(gè)人都會(huì)被按照最重的罪來(lái)判決，誰(shuí)也不會(huì)得到獎(jiǎng)賞。

----那么，這兩個(gè)囚犯該怎么辦呢？是選擇互相合作還是互相背叛？從表面上看，他們應(yīng)該互相合作，保持沉默，因?yàn)檫@樣他們倆都能得到最好的結(jié)果：自由。但他們不得不仔細(xì)考慮對(duì)方可能采取什么選擇。A犯不是個(gè)傻子，他馬上意識(shí)到，他根本無(wú)法相信他的同伙不會(huì)向警方提供對(duì)他不利的證據(jù)，然后帶著一筆豐厚的獎(jiǎng)賞出獄而去，讓他獨(dú)自坐牢。這種想法的誘惑力實(shí)在太大了。但他也意識(shí)到，他的同伙也不是傻子，也會(huì)這樣來(lái)設(shè)想他。所以A犯的結(jié)論是，唯一理性的選擇就是背叛同伙，把一切都告訴警方，因?yàn)槿绻耐锉康弥粫?huì)保持沉默，那么他就會(huì)是那個(gè)帶獎(jiǎng)出獄的幸運(yùn)者了。而如果他的同伙也根據(jù)這個(gè)邏輯向警方交代了，那么，A犯反正也得服刑，起碼他不必在這之上再被罰款。所以其結(jié)果就是，這兩個(gè)囚犯按照不顧一切的邏輯得到了最糟糕的報(bào)應(yīng)：坐牢。

假設(shè)豬圈里有兩頭豬同在一個(gè)食槽里進(jìn)食，一頭大豬，一頭小豬。我們假設(shè)它們都是有著認(rèn)識(shí)和實(shí)現(xiàn)自身利益的充分理性的“智豬”，豬圈兩頭距離很遠(yuǎn)，一頭安裝了一只控制飼料供應(yīng)的踏板，另一頭是飼料的出口和食槽。豬每踩一下踏板，另一頭就會(huì)有相當(dāng)于10份的飼料進(jìn)槽，但是踩踏板以及跑到食槽所需要付出的“勞動(dòng)”，加起來(lái)要消耗相當(dāng)于2份的飼料。

兩頭豬可以選擇的策略有兩個(gè)：自己去踩踏板或等待另一頭豬去踩踏板。如果某一頭豬做出自己去踩踏板的選擇，不僅要付出勞動(dòng)，消耗掉2份飼料，而且由于踏板遠(yuǎn)離飼料，它將比另一頭豬后到食槽，從而減少吃到飼料的數(shù)量。我們假定：若大豬先到（即小豬踩踏板），大豬將吃到9份的飼料，小豬只能吃到1份的飼料，最后雙方得益為【9，-1】；若小豬先到（即大豬踩踏板），大豬和小豬將分別吃到6份和4份的飼料。最后雙方得益為【4，4】；若兩頭豬同時(shí)踩踏板，同時(shí)跑向食槽，大豬吃到7份的飼料，小豬吃到3份的飼料，即雙方得益為【5，1】；若兩頭豬都選擇等待，那就都吃不到飼料，即雙方得益均為0。

智豬博弈的收益矩陣可以用下表所示、表中的數(shù)字表示不同選擇下每頭豬所能吃到的飼料數(shù)量減去前去踩踏板的成本之后的凈收益水平。

大豬行動(dòng) 大豬等待

小豬行動(dòng) 5, 1 9, -1

小豬等待 4, 4 0, 0

智豬博弈的收益矩陣

那么這個(gè)博弈的均衡解是什么呢?這個(gè)博弈的均衡解是大豬選擇去踩踏板，小豬選擇等待，這時(shí)，大豬和小豬的凈收益水平均為4個(gè)單位。這是一個(gè)“多勞不多得，少勞不少得”的均衡。

在找出上述智豬博弈的均衡解時(shí)，我們實(shí)際上是按照“重復(fù)剔除嚴(yán)格劣勢(shì)策略”的邏輯思路進(jìn)行的。這一思路可以歸納如下：首先找出某參與人的嚴(yán)格劣勢(shì)策略，將它剔除，重新構(gòu)造一個(gè)不包括已剔除策略的新博弈；然后，繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣勢(shì)策略；重復(fù)進(jìn)行這一過(guò)程，直到剩下唯一的策略組合為止。剩下這個(gè)唯一的策略組合，就是這個(gè)博弈的均衡解，稱(chēng)為“重復(fù)剔除的占有策略均衡”。

在智豬博弈收益矩陣中可以看出：小豬踩踏板其能得到l份甚至損失1份，不踩踏板反而能得到4份。對(duì)小豬而言，無(wú)論大豬是否踩動(dòng)踏板，小豬采取“搭便車(chē)”策略，也就是舒舒服服地等在食槽邊，都是最好的選擇。

大豬行動(dòng) 大豬等待

小豬行動(dòng) 5, 1 9, -1

小豬等待 4, 4 0, 0

剔除后的智豬博弈的收益矩陣

由于小豬有“等待”這個(gè)優(yōu)勢(shì)策略，大豬只剩下了兩個(gè)選擇：等待就吃不到；踩踏板得到4份。所以“等待”就變成了大豬的劣勢(shì)策略，當(dāng)大豬知道小豬是不會(huì)去踩動(dòng)踏板的，自己親自去踩踏板總比不踩強(qiáng)，只好為自己的4份飼料不知疲倦地奔忙于踏板和食槽之間。

也就是說(shuō)，無(wú)論大豬選擇什么策略，選擇踩踏板對(duì)小豬都是一個(gè)嚴(yán)格劣勢(shì)策略，我們首先加以剔除。在剔除小豬踩踏板這一選擇后的新博弈中，小豬只有等待一個(gè)選擇，而大豬則有兩個(gè)可供選擇的策略。在大豬這兩個(gè)可供選擇的策略中，選擇等待是一個(gè)嚴(yán)格劣勢(shì)策略，我們?cè)偬蕹虏┺闹写筘i的嚴(yán)格劣勢(shì)策略等待。剩下的新博弈中只有小豬等待、大豬踩踏板這一個(gè)可供選擇的策略，這就是智豬博弈的最后均衡解，達(dá)到重復(fù)剔除的優(yōu)勢(shì)策略均衡。

智豬博弈與囚徒困境的不同之處在于：囚徒困境中的犯罪嫌疑人都有自己的嚴(yán)格優(yōu)勢(shì)策略；而智豬博弈中，只有小豬有嚴(yán)格優(yōu)勢(shì)策略，而大豬沒(méi)有。

在一場(chǎng)博弈中，如果每個(gè)參與人都有嚴(yán)格優(yōu)勢(shì)策略。那么嚴(yán)格優(yōu)勢(shì)策略均衡是合乎邏輯的。但是在絕大多數(shù)博弈中。這種嚴(yán)格優(yōu)勢(shì)策略均衡并不存在。而只存在重復(fù)剔除的優(yōu)勢(shì)策略均衡。所以，智豬博弈聽(tīng)起來(lái)似乎有些滑稽，但是它卻是一個(gè)根據(jù)優(yōu)勢(shì)策略的邏輯找出均衡的博弈模型。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶(hù)發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：哈哈哈一笑 > 《政治經(jīng)濟(jì)》

舉報(bào)/認(rèn)領(lǐng)