【來稿】查理.布朗該踢那顆球嗎?逆推可解的賽局 | 哲學新媒體
來稿

查理.布朗該踢那顆球嗎?逆推可解的賽局

《思辨賽局》書摘
預測你最初的決策最後可能導致什麼後果,藉此確定自己的最佳選擇。在查理.布朗的故事裡,做到這一點對所有人來說應該都不費吹灰之力(只有好人查理.布朗例外)。查理只有兩個選擇,其中一個會導致露西在兩種可能行動之間進行決策。大多數策略情境都會涉及一長串的決策序列,每個決策又對應著幾種選擇。在這樣的賽局中,以一個可以涵蓋賽局中全部選擇的樹狀圖,作為視覺輔助工具,有助於我們進行正確的推理。

您在這裡

難度:
2

文 /  阿維納什.迪克西特 (Avinash Dixit)、貝利.奈勒波夫 (Barry J. Nalebuff)

該你了,查理.布朗

連環漫畫《史努比》中有一個反覆出現的主題,說的是露西將一顆足球按在地上,招呼查理.布朗跑去踢那個球。但在最後一刻,露西卻拿走了足球,讓查理.布朗一腳踢空,跌個四腳朝天,而心懷不軌的露西則開心得不得了。

《史努比》漫畫,舒爾茲畫,商周出版授權使用。
任何人都會勸查理不要再上露西的當。即便露西去年(以及前年和大前年)沒有在他身上玩過這個花招,他也應該從其他事情了解她的性格,完全可以預見她會玩什麼花招。

雖然在查理盤算要不要接受露西邀請去踢球時,露西的行動還沒有發生。不過,單憑她的行動還沒有發生這一點,並不意味著查理就應該把這個行動看做不確定的。他應該知道,在兩種可能的結果中,讓他踢中那個球以及看他四腳朝天,露西是偏好後者的。因此,他應該能料想得到,一旦真要出腳,露西就會把球拿開,露西根本不可能讓他踢中那顆球。但查理卻仍然抱持信心,借用詹森博士 (Dr. Johnson) 描述的再婚特徵,是一種「希望」壓倒「經驗」的勝利。查理不該那樣想,而應該預見到接受露西的邀請最終會不可避免地讓自己四腳朝天。他應該拒絕露西的邀請。

策略互動的兩種方式

策略賽局的本質在於參與者的決策相互依存。這種相互作用或互動透過兩種方式表現出來。第一種方式是逐步 (sequential) 發生,比如查理.布朗的故事。參與者輪流出招。當輪到查理時,他必須預測一下他當前的行動將會給露西隨後的行動產生什麼影響,反過來又會對自己以後的行動產生什麼影響。

第二種互動方式是同步 (simultaneous) 發生,參與者同步出招,完全不顧及其他人的行動。不過,每個人必須心中有數,明白這個賽局中還有其他積極的參與者,而這些人反過來同樣非常清楚這一點,依此類推。從而,每個人必須將自己置身於他人的立場,來評估自己的這一步行動會招致什麼後果;其最佳行動將是全盤考量的重要一部分。

一旦你發現自己正在參與一場策略性賽局,你必須確定其中的互動究竟是逐步發生還是同步發生的。有些賽局,比如足球比賽,同時具備上述兩類互動元素,這時你必須確保自己的策略符合整個環境的條件。我們將初步介紹一些有助於參與逐步行動賽局的概念和法則。

∷ 第一條策略法則

逐步行動賽局的一般原則是,每個參與者必須推測其他參與者接下來的反應,並據此盤算自己當前的最佳行動。這一點非常重要,值得確立為一條基本的策略行為法則。

法則 1:向前預測,倒後推理

預測你最初的決策最後可能導致什麼後果,藉此確定自己的最佳選擇。

在查理.布朗的故事裡,做到這一點對所有人來說應該都不費吹灰之力(只有好人查理.布朗例外)。查理只有兩個選擇,其中一個會導致露西在兩種可能行動之間進行決策。大多數策略情境都會涉及一長串的決策序列,每個決策又對應著幾種選擇。在這樣的賽局中,以一個可以涵蓋賽局中全部選擇的樹狀圖,作為視覺輔助工具,有助於我們進行正確的推理。現在就示範如何運用。

決策樹與賽局樹

即使一個孤立的決策者,置身於一個有其他參與者的策略賽局中,也可能會面對需要向前預測、倒後推理 (look forward and reason backward) 的決策過程。例如,走在黃樹林中的美國詩人佛洛斯特 (Robert Frost):

兩條路在樹林裡分岔,而我,
我選擇人跡罕至的那一條,
從此一切變了樣。

我們可以對此圖示如下:

(商業周刊授權使用)
到此未必就不用再選擇了。每條路後面可能還會有分岔,這個圖相對地會變得越來越複雜。以下是我們親身經歷的一個例子。

從普林斯頓到紐約旅行會遇到幾次選擇。第一個決策點是選擇旅行的方式:搭乘巴士、火車還是自己開車。選擇自己開車的人接下來就要選擇走費拉扎諾橋、霍蘭隧道、林肯隧道還是華盛頓橋。選擇火車的人必須決定是在紐華克換乘 PATH 列車,還是直達紐約 Penn 車站。等進入紐約,搭乘火車或巴士的人還必須決定怎樣抵達目的地,是步行、搭地鐵(本地地鐵還是高速地鐵)、公車還是計程車。最佳選擇取決於多種因素,包括價格、速度、不可避免的交通堵塞、最終目的地所在,以及對紐澤西收費公路上的空氣污染的厭惡程度等等。

這個路徑圖畫出了你在每個岔路口的選擇,看起來就像一棵枝繁葉茂的大樹,所以稱為「決策樹」。正確使用這張圖的方法,絕不是選擇第一個分支看上去最簡單的路線。例如,各種方式的其他條件相同時,你會更喜歡自己開車而不是搭火車,然後「到達下一個岔路口的時候再穿過費拉扎諾橋」。相反的,你應該推估以後將面臨的選擇,然後做出初步決策。舉個例子,如果你想去市區,搭 PATH 列車會比開車好,因為搭 PATH 列車可以從紐華克直達市區。

我們可以透過下圖來描述一個策略賽局中的選擇。不過,現在圖中出現了一個新元素。我們遇到了一個有兩個人或更多人參與的賽局。沿著這棵樹的各個決策點,可能是不同的參與者在進行決策。每個參與者在前一個決策點做決策時必須向前預測,不僅要預測他自己的未來決策,還要預測其他參與者的未來決策。他必須推測其他人的下一步決策,辦法就是想像自己站在他們的位置,按照他們的思維方式思考。為了強調這個做法與前一個做法的區別,我們把反映策略賽局中決策過程的樹稱為賽局樹 (game tree),而把決策樹 (decision tree) 用來描述只有一人賽局的情形。

(商業周刊授權使用)

∷ 足球賽和商界中的查理布朗

儘管本章開頭提到的查理.布朗的故事非常簡單,不過把故事轉化成以下的圖示,你就可以更加熟悉賽局樹。在賽局起點,當露西發出邀請時,查理.布朗面臨是否接受邀請的決策。假如查理拒絕了,那麼這場賽局到此為止。假如他接受邀請,露西就面臨兩個選擇,一是讓查理踢球,二是把球拿開。我們可以透過在路上添加另一個分叉的方法說明這一點。

(商業周刊授權使用)

正如我們先前所述,查理應該預料到露西一定會選擇上面那個分支。因此,他應該站在露西的立場,從這棵樹上剪掉下面那個分支。現在,如果他再選擇自己上面的那個分支,結局一定是四腳朝天。因此,他最好選擇下面的分支。我們用加粗的帶箭頭的分支來表示這些選擇。

你是否認為這個賽局太微不足道?以下是一個商業界的版本。設想以下情況,已成年的查理目前正在(假設)弗里多尼亞國 (Freedonia) 度假。他和當地的一個生意人弗里多 (Fredo) 聊了起來,弗里多談起一個只要投入資金就可以獲利的絕佳機會,他大聲說道:「你給我 10 萬美元,一年後我會把它變成 50 萬美元,到時候我和你平分這筆錢。所以,你將在一年內獲得兩倍以上的錢。」弗里多所說的機會確實令人嚮往,何況他很樂意按照弗里多尼亞的法律規定簽訂一份正式合約。但弗里多尼亞的法律有多可靠?如果一年後弗里多捲款潛逃,已經返回美國的查理能向弗里多尼亞的法院要求執行這份合約嗎?法院有可能會偏袒自己的國民,或者可能效率很低,又或者可能被弗里多收買。因此,查理實際上是在和弗里多進行一場賽局,賽局樹如下圖所示。(注意,如果弗里多遵守合約,他會付給查理 25 萬美元;則查理獲得的利潤等於 25 萬美元減去初始投資 10 萬美元,即 15 萬美元。)

(商業周刊授權使用)
你認為弗里多會怎麼做?在沒有十足相信弗里多承諾的情況下,查理應該預料到弗里多一定會捲款潛逃,就像小查理確定露西一定會把球拿開一樣。事實上,兩個賽局樹在本質上是相同的。但是,面臨這樣的賽局時,多少「查理」做出了錯誤的推理?

有什麼理由可以讓查理相信弗里多的承諾?或許,弗里多同時也和某些企業做生意,這些企業需要在美國融資或者出口商品到美國去。那麼,為了報復弗里多,查理很有可能會破壞弗里多在美國的聲譽或者直接扣押他的貨品。所以,這個賽局可能只是更大賽局的一部分,或許是一個持續進行的過程,以此確定弗里多的誠信。但是,在我們上述說明的一次性賽局中,這種倒後推理的邏輯已經是非常清楚了。

思辨賽局
思辨賽局
我們希望藉由這個賽局得到三點結論。第一,不同的賽局可以採用相同的或者極為相似的數學形式。用這種形式來進行思考,反過來又凸顯出各種賽局的相似性,你會更得心應手地將某個賽局的知識運用到其他賽局。這是所有學科理論的重要功能:它萃取出各種不同狀況的相同本質,使得個人能夠以一種統一而簡化的方式對各種情況進行思考分析。許多人本能地討厭所有理論,但我們認為這反應是錯誤的。當然,理論確實有其侷限性,特殊的情境和經驗通常會擴充或修正理論的某些方法。但是,拋棄所有理論就相當於拋棄一個有價值的思考出發點,一個克服難題的立足點。當你進行策略思維時,你應該把賽局理論當朋友,而不是困擾。

第二,弗里多應該意識到,具有策略思維的查理一定會懷疑他所說的話的可靠性,而且根本不會投資,這樣,弗里多就失去了賺取25萬美元的機會。因此,弗里多有強烈的動機使其承諾值得相信。

第三,或許也是最重要的一個結論,比較參與者「不同的」選項所帶來不同結果。一個參與者得到更多,並不一定代表另一個參與者會得到更少。查理選擇投資而弗里多選擇遵守合約這種對雙方都有利的情形,優於查理根本不投資的情形。和運動賽事或其他比賽不同,賽局不一定非要有勝出者和失敗者;用賽局理論的術語來說就是,它們並不一定是零和賽局,即賽局可能出現雙贏 (win-win) 和雙輸 (lose-lose) 的結果。事實上,共同利益(比如,若弗里多有辦法給出遵守合約的堅定承諾,則查理和弗里多雙方都能獲益)和衝突(比如,若弗里多在查理投資之後捲款潛逃,查理就要付出極高的代價)的結合同時存在於商界、政界以及社會往來活動的大多數賽局中。這正是使得分析這些賽局如此有趣並具挑戰性的原因。

※ 本文為商業收周刊授權刊登之書摘,摘自Dixit, B. J. Nalebuf (2024).  思辨賽局. pp.45-52,文章標題由編輯團隊所下。

《商業周刊》出版部成立於 2010 年,引進國外重要財經著作、記錄臺灣重要觀點。
訂閱會員推薦
推薦
0 人投票。
訂閱哲學新媒體,支持作者持續創作、打造長長久久的哲普推廣與哲學教育平台。