以下是幾種經典的博弈論現象:
囚徒困境現象
兩個嫌疑犯作案后被警察抓住,分別關在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。于是,每個囚徒都面臨兩種選擇:坦白或抵賴。
這個時候如果你是囚犯,又無法信任對方,你會怎么選呢?
我們把它做成圖表,就更容易看了:
由上可知,除非兩人都選擇沉默,達到對彼都最優的結果。否則其他情況都是自己坦白比沉默來的利益豐厚,而且對方也是面臨這樣的選擇,因此,無論是是避免對自己最壞情況發生,還是博取最好的情況,兩者都會選擇背叛,最終結果是彼此服刑八年。相對于雙方沉默換取的1年刑期,可謂大大的不智。
那么如何避免呢?而不是僅僅彼此指責,原來你是這樣一個同伙兒。現實中的如果加上另外一些限制手段那就更好了,比如說兩個囚犯有小弟,誰背叛了對方小弟就會砍死誰,那么這個額外的懲罰手段就會使得雙方達成彼此寶貴的沉默。
自己也成為囚徒困境中的一方,想要不被背叛,那就增加對方沉默所得利益,背叛付出的代價吧。
“一報還一報原則”導向合作
一次囚徒博弈可能會造成雙輸的局面,但是如果是多次囚徒博弈,尤其是不限次的囚徒博弈,則不然。由于前次的抉擇彼此雙方都能知曉,那么第二次囚徒博弈之后,被背叛的方會選擇報復,因此,為了避免報復,雙方就會形成攻守同盟,達到帕累托最優。
當然前提是堅守“一報還一報”原則,沉默回報以沉默,背叛回報以背叛,只有如此,這個帕累托最優才會達成,如果沒有獎懲制度,背叛無代價,同盟無獎賞,只會換來對方的背叛而已。
在這個次數不可預先知道的情況下,的確如此。但如果多次囚徒博弈的次數是限定的,依然有可能導向最壞結果。假如為三次,最后一次選擇之后,無論什么選擇都不會受到獎賞,遭到報復。博弈的情況又會回到單次博弈上,知道第三次注定要背叛之后,第二次博弈會率先背叛對方以報復之,同理,第一次的結果只能導向彼此背叛。因此,報復必須延續下去,任何一次背叛都有可能遭到背叛,才有可能讓合作繼續下去。
這也解釋了為何人類有著極度利己精神,人類社會的合作能夠達成。如何善用獎懲措施,引導每個人的利己心理向著最優結果,成了領導者考慮的問題。
智豬博弈
假設豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時到槽邊,收益比是7∶3;小豬先到槽邊,收益比是6∶4。
大豬、小豬彼此之間博弈的成果,做成圖表如下:
由圖表可知,小豬等待的收益要高于行動的收益,小豬最好的策略就是去等待。這解釋了為何現實中有些人即便什么都不做也能收獲更多,作為領導者,除了設計制度避免員工當中智豬博弈情形誕生,在參與競爭過程當中,也應當盡量成為小豬,而非大豬。
“市場進入阻撓”博弈
上面兩個例子多少有點離商業遠,那么就來個產業經濟學的經典例子——“市場進入阻撓”。假設一個領域已經有壟斷者了,這個時候如果你想進入這個領域,和他競爭,是進還是不進呢?或者說如何以最小成本進入這個領域?
假設壟斷者壟斷的時候收益300億,被你進入這個領域后,和你一起賺100億,每人50億。你進入這個領域成本是10億元,同時,壟斷者選擇阻止則會損失300億。
那么,是進入還是不進入呢?這里要涉及到納什均衡概念,所謂納什均衡,即同一時間內每個參與人的策略是對其他參與人策略的最優反應。壟斷者由于選擇阻止將利潤損失殆盡,那么其就只會選擇默認,你只需要進入即可,無需考慮壟斷者會阻止而帶來的損失。
以上是完全信息之下的納什均衡,但在現實當中,這種完全信息幾乎不可能存在,那么就需要考慮壟斷者阻止帶來的影響。
假設你現在知道壟斷者阻止你可能會損失300億,但這個不確定。你只知道壟斷者有一定的概率會阻止你,這個概率為X,那么默認的概率就是1-X。
那么,你進入這一領域,可能獲利為40(1-X)+(-10)X。只有當該X<0.8時,進入的收益才會大于不進入的收益。依據公式,你將得到最優決策。
現實商業活動和管理行為當中的決策當然更加復雜,也擁有更多不確定性,但將其還原為數字,得到最優解,將有助于獲取己方利益最大化。