2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

博弈論經(jīng)典案例:兩頭豬與囚徒困境

 哈哈哈一笑 2012-08-28

學(xué)習(xí)管理學(xué)或經(jīng)濟(jì)學(xué)的人一定都了解一些博弈論方面的知識(shí)。在博弈論中有一個(gè)經(jīng)典案例——囚徒困境,非常耐人回味。

----“囚徒困境”說(shuō)的是兩個(gè)囚犯的故事。這兩個(gè)囚徒一起做壞事,結(jié)果被警察發(fā)現(xiàn)抓了起來(lái),分別關(guān)在兩個(gè)獨(dú)立的不能互通信息的牢房里進(jìn)行審訊。在這種情形下,兩個(gè)囚犯都可以做出自己的選擇:或者供出他的同伙(即與警察合作,從而背叛他的同伙),或者保持沉默(也就是與他的同伙合作,而不是與警察合作)。這兩個(gè)囚犯都知道,如果他倆都能保持沉默的話(huà),就都會(huì)被釋放,因?yàn)橹灰麄兙懿怀姓J(rèn),警方無(wú)法給他們定罪。但警方也明白這一點(diǎn),所以他們就給了這兩個(gè)囚犯一點(diǎn)兒刺激:如果他們中的一個(gè)人背叛,即告發(fā)他的同伙,那么他就可以被無(wú)罪釋放,同時(shí)還可以得到一筆獎(jiǎng)金。而他的同伙就會(huì)被按照最重的罪來(lái)判決,并且為了加重懲罰,還要對(duì)他施以罰款,作為對(duì)告發(fā)者的獎(jiǎng)賞。當(dāng)然,如果這兩個(gè)囚犯互相背叛的話(huà),兩個(gè)人都會(huì)被按照最重的罪來(lái)判決,誰(shuí)也不會(huì)得到獎(jiǎng)賞。

 

----那么,這兩個(gè)囚犯該怎么辦呢?是選擇互相合作還是互相背叛?從表面上看,他們應(yīng)該互相合作,保持沉默,因?yàn)檫@樣他們倆都能得到最好的結(jié)果:自由。但他們不得不仔細(xì)考慮對(duì)方可能采取什么選擇。A犯不是個(gè)傻子,他馬上意識(shí)到,他根本無(wú)法相信他的同伙不會(huì)向警方提供對(duì)他不利的證據(jù),然后帶著一筆豐厚的獎(jiǎng)賞出獄而去,讓他獨(dú)自坐牢。這種想法的誘惑力實(shí)在太大了。但他也意識(shí)到,他的同伙也不是傻子,也會(huì)這樣來(lái)設(shè)想他。所以A犯的結(jié)論是,唯一理性的選擇就是背叛同伙,把一切都告訴警方,因?yàn)槿绻耐锉康弥粫?huì)保持沉默,那么他就會(huì)是那個(gè)帶獎(jiǎng)出獄的幸運(yùn)者了。而如果他的同伙也根據(jù)這個(gè)邏輯向警方交代了,那么,A犯反正也得服刑,起碼他不必在這之上再被罰款。所以其結(jié)果就是,這兩個(gè)囚犯按照不顧一切的邏輯得到了最糟糕的報(bào)應(yīng):坐牢。
 

假設(shè)豬圈里有兩頭豬同在一個(gè)食槽里進(jìn)食,一頭大豬,一頭小豬。我們假設(shè)它們都是有著認(rèn)識(shí)和實(shí)現(xiàn)自身利益的充分理性的“智豬”,豬圈兩頭距離很遠(yuǎn),一頭安裝了一只控制飼料供應(yīng)的踏板,另一頭是飼料的出口和食槽。豬每踩一下踏板,另一頭就會(huì)有相當(dāng)于10份的飼料進(jìn)槽,但是踩踏板以及跑到食槽所需要付出的“勞動(dòng)”,加起來(lái)要消耗相當(dāng)于2份的飼料。

兩頭豬可以選擇的策略有兩個(gè):自己去踩踏板或等待另一頭豬去踩踏板。如果某一頭豬做出自己去踩踏板的選擇,不僅要付出勞動(dòng),消耗掉2份飼料,而且由于踏板遠(yuǎn)離飼料,它將比另一頭豬后到食槽,從而減少吃到飼料的數(shù)量。我們假定:若大豬先到(即小豬踩踏板),大豬將吃到9份的飼料,小豬只能吃到1份的飼料,最后雙方得益為【9,-1】;若小豬先到(即大豬踩踏板),大豬和小豬將分別吃到6份和4份的飼料。最后雙方得益為【4,4】;若兩頭豬同時(shí)踩踏板,同時(shí)跑向食槽,大豬吃到7份的飼料,小豬吃到3份的飼料,即雙方得益為【5,1】;若兩頭豬都選擇等待,那就都吃不到飼料,即雙方得益均為0。

智豬博弈的收益矩陣可以用下表所示、表中的數(shù)字表示不同選擇下每頭豬所能吃到的飼料數(shù)量減去前去踩踏板的成本之后的凈收益水平。

大豬行動(dòng) 大豬等待

小豬行動(dòng) 5, 1 9, -1

小豬等待 4, 4 0, 0

智豬博弈的收益矩陣

那么這個(gè)博弈的均衡解是什么呢?這個(gè)博弈的均衡解是大豬選擇去踩踏板,小豬選擇等待,這時(shí),大豬和小豬的凈收益水平均為4個(gè)單位。這是一個(gè)“多勞不多得,少勞不少得”的均衡。

在找出上述智豬博弈的均衡解時(shí),我們實(shí)際上是按照“重復(fù)剔除嚴(yán)格劣勢(shì)策略”的邏輯思路進(jìn)行的。這一思路可以歸納如下:首先找出某參與人的嚴(yán)格劣勢(shì)策略,將它剔除,重新構(gòu)造一個(gè)不包括已剔除策略的新博弈;然后,繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣勢(shì)策略;重復(fù)進(jìn)行這一過(guò)程,直到剩下唯一的策略組合為止。剩下這個(gè)唯一的策略組合,就是這個(gè)博弈的均衡解,稱(chēng)為“重復(fù)剔除的占有策略均衡”。

在智豬博弈收益矩陣中可以看出:小豬踩踏板其能得到l份甚至損失1份,不踩踏板反而能得到4份。對(duì)小豬而言,無(wú)論大豬是否踩動(dòng)踏板,小豬采取“搭便車(chē)”策略,也就是舒舒服服地等在食槽邊,都是最好的選擇。

大豬行動(dòng) 大豬等待

小豬行動(dòng) 5, 1 9, -1

小豬等待 4, 4 0, 0

剔除后的智豬博弈的收益矩陣

由于小豬有“等待”這個(gè)優(yōu)勢(shì)策略,大豬只剩下了兩個(gè)選擇:等待就吃不到;踩踏板得到4份。所以“等待”就變成了大豬的劣勢(shì)策略,當(dāng)大豬知道小豬是不會(huì)去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強(qiáng),只好為自己的4份飼料不知疲倦地奔忙于踏板和食槽之間。

也就是說(shuō),無(wú)論大豬選擇什么策略,選擇踩踏板對(duì)小豬都是一個(gè)嚴(yán)格劣勢(shì)策略,我們首先加以剔除。在剔除小豬踩踏板這一選擇后的新博弈中,小豬只有等待一個(gè)選擇,而大豬則有兩個(gè)可供選擇的策略。在大豬這兩個(gè)可供選擇的策略中,選擇等待是一個(gè)嚴(yán)格劣勢(shì)策略,我們?cè)偬蕹虏┺闹写筘i的嚴(yán)格劣勢(shì)策略等待。剩下的新博弈中只有小豬等待、大豬踩踏板這一個(gè)可供選擇的策略,這就是智豬博弈的最后均衡解,達(dá)到重復(fù)剔除的優(yōu)勢(shì)策略均衡。

智豬博弈與囚徒困境的不同之處在于:囚徒困境中的犯罪嫌疑人都有自己的嚴(yán)格優(yōu)勢(shì)策略;而智豬博弈中,只有小豬有嚴(yán)格優(yōu)勢(shì)策略,而大豬沒(méi)有。

在一場(chǎng)博弈中,如果每個(gè)參與人都有嚴(yán)格優(yōu)勢(shì)策略。那么嚴(yán)格優(yōu)勢(shì)策略均衡是合乎邏輯的。但是在絕大多數(shù)博弈中。這種嚴(yán)格優(yōu)勢(shì)策略均衡并不存在。而只存在重復(fù)剔除的優(yōu)勢(shì)策略均衡。所以,智豬博弈聽(tīng)起來(lái)似乎有些滑稽,但是它卻是一個(gè)根據(jù)優(yōu)勢(shì)策略的邏輯找出均衡的博弈模型。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多