博弈論是研究互動(dòng)決策的方法論。既然是互動(dòng)決策,博弈便不是一個(gè)人的決策。每個(gè)人的身邊都是和他一樣的決策者。甲的決策對乙的決策產(chǎn)生影響,同樣乙的決策也影響著甲的決策。乙的決策是對甲的決策的回應(yīng),同樣甲的決策是對乙的決策做出的反應(yīng)。人們往往沒有意識(shí)到在決策時(shí)考慮了別人可能的反應(yīng),然而在現(xiàn)實(shí)生活中,人們的決策很可能是本能地,但又不經(jīng)意地對別人的決策做出的反應(yīng)。人們常說,出招的時(shí)候要先考慮對方會(huì)怎么回招,這個(gè)思考方法便是博弈思維。
人們的決策相互影響的例子很多。比如:戀愛中的情侶,他們之間的約會(huì)、示愛的行為存在著相互影響的決策關(guān)系;冷戰(zhàn)時(shí)期的美蘇核平衡是一種互動(dòng)決策關(guān)系;寡頭市場上,寡頭企業(yè)關(guān)于產(chǎn)量和價(jià)格的決策是雙方在考慮對方?jīng)Q策的基礎(chǔ)上做出的回應(yīng);稅務(wù)局與納稅企業(yè)之間,稅收稽查與逃稅行為之間存在互動(dòng)決策關(guān)系;道路上行駛的汽車駕駛員在做“駕駛博弈”的互動(dòng);企業(yè)與工會(huì)之間的工資談判是勞資談判博弈。
一個(gè)博弈由三個(gè)要素構(gòu)成。一是參與人,在一場博弈中,參與該博弈并有決策權(quán)的人就是參與人。二是策略,策略是實(shí)際可行的行動(dòng)方案和行動(dòng)規(guī)則,這個(gè)行動(dòng)規(guī)則不是參與人某一個(gè)或者幾個(gè)行動(dòng)的規(guī)則,而是貫穿整個(gè)博弈過程和全局的行動(dòng)方案和規(guī)則。三是得失或收益,參與人參與博弈必然有其利益在其中,人們之所以參與博弈是受到利益的吸引,對未來所獲得利益的大小的預(yù)期直接關(guān)系到參與人的策略和博弈結(jié)果。得失或收益就是指參與人在博弈中能夠獲得什么樣的利益,這個(gè)利益不是純粹的經(jīng)濟(jì)利益,而是參與人使自己的各種需求、欲望得到的滿足。博弈參與人在博弈中追求的是自身收益的最大化,而最大化的收益需要參與人尋找最佳策略(行動(dòng)規(guī)則)來實(shí)現(xiàn)。
例如,駕駛博弈中,博弈的參與人是在路上駕駛的駕駛員。駕駛員的策略有:當(dāng)別人靠右行駛時(shí),我也靠右行駛;當(dāng)別人靠右行駛時(shí),我靠左行駛;當(dāng)別人靠左行駛時(shí),我也靠左行駛;當(dāng)別人靠左行駛時(shí),我靠右行駛。我們可以假設(shè)如果駕駛員都在同一個(gè)方向行駛,大家都得益,每人收益為1;大家都逆向行駛,行車不便,甚至撞車,每個(gè)駕駛員收益為-1。這個(gè)博弈的最優(yōu)策略是當(dāng)別人靠右行駛時(shí),我也靠右行駛,或者當(dāng)別人靠左行駛時(shí),我也靠左行駛。博弈的結(jié)果是大家都靠一邊行駛,要么像我國一樣靠右行駛,要么像英國一樣靠左行駛,每個(gè)駕駛員的收益是1。
博弈論的基本思維方法是向前展望,往回推理。向前展望就是在決策的時(shí)候要先考慮自己的決策可能引起對手的后續(xù)反應(yīng),以及后續(xù)反應(yīng)之后的反應(yīng),依此推斷對手在博弈中一步步接下來的反應(yīng),看清自己的行動(dòng)將會(huì)導(dǎo)致怎樣的后果,以及在對手做出反應(yīng)后,雙方的行動(dòng)會(huì)出現(xiàn)什么結(jié)果。往回推理就是在向前展望的基礎(chǔ)上,將展望的結(jié)果作為最初決策的相關(guān)因素加以考慮,從最后一步的結(jié)果開始,逐步往回倒推,只到博弈開始的第一步,找出自己在每一步的最優(yōu)選擇。例如,博弈中帶有一個(gè)“弈”字就是因?yàn)橄缕褰凶鲗?。下棋的思考過程就是典型的博弈思維過程。下棋的時(shí)候,棋手要向前盤算幾步,并且考慮自己每一步的出招對方會(huì)怎么回招,自己再怎么接這個(gè)回招,以及這一個(gè)回合對下一個(gè)回合的后續(xù)影響,這是向前展望。在考慮好了后,再往回推理自己當(dāng)前應(yīng)該選擇走出哪一步棋在后續(xù)的對弈回合中對自己最有利。