他用“玩具,球拍,鋼筆”發(fā)了一篇頂刊論文……
小約翰·納什( John F. Nash Jr. ,1928-2015)最著名的突破是發(fā)現(xiàn)納什均衡,但在這之前,他還針對(duì)另一個(gè)問題,納什議價(jià)(討價(jià)還價(jià))問題撰寫了一篇論文。納什議價(jià)問題是一個(gè)關(guān)于合作議價(jià)的研究,求證兩人討價(jià)還價(jià)問題的唯一解(Nash,1950).議價(jià)問題中的設(shè)定可以簡單總結(jié)如下:
兩個(gè)玩家各自要求獲得一些財(cái)物(一般是一些金錢)中的一部分。如果二人索取的總和少于財(cái)物總額,那么兩人都能如愿以償;如果總和超過了財(cái)物總額,那么兩人什么都沒有。
納什對(duì)于后面這種情況提出了一個(gè)公理化的解決方法,本文就將介紹納什剛涉足馮諾依曼和摩根斯坦新發(fā)現(xiàn)的博弈論領(lǐng)域時(shí)首先獲得的成果,這為日后關(guān)于納什均衡的工作提供了靈感。
1.不變性:在議價(jià)前后效用函數(shù)隨偏好的轉(zhuǎn)變應(yīng)保持不變。
2.弱帕累托有效:如果有兩人都能獲益更多的結(jié)果s,那么玩家就不能同意另一種分配t。
3.無關(guān)選擇的獨(dú)立性:如果玩家在兩個(gè)解s和t中選擇,其中s是首選;如果一個(gè)備選解r出現(xiàn),那么除非r的偏好變化,t仍不會(huì)超過s被選擇為解。
4.對(duì)稱性:如果玩家之間沒有區(qū)別,那么他們之間達(dá)成協(xié)議不應(yīng)有偏袒。
納什證明,滿足上述公理?xiàng)l件的解(x,y)正好可以使下面的表達(dá)式F取最大值:(u(x) — u(d)) (v(y) — v(d))
其中,u和v分別是玩家1和玩家2的效用函數(shù),d則是無法達(dá)成協(xié)議的結(jié)果。這個(gè)解包含每個(gè)玩家獲得當(dāng)前收益(非合作收益)和合作收益。
背景
在離開位于西弗吉尼亞布魯菲爾德的家鄉(xiāng)三年后,20歲的納什進(jìn)入了大學(xué)。1948年,當(dāng)他還是卡耐基理工學(xué)院大三的學(xué)生時(shí),就已經(jīng)獲得了哈佛、普林斯頓、芝加哥和密歇根大學(xué),四個(gè)擁有美國頂尖數(shù)學(xué)項(xiàng)目的錄取。雖然納什的首選是相對(duì)更有名、社會(huì)地位和師資力量更強(qiáng)的哈佛大學(xué),但由于在備受推崇的普特南競賽中表現(xiàn)平平,他在哈佛的獎(jiǎng)學(xué)金略低于普林斯頓;同時(shí),納什在卡耐基的學(xué)術(shù)導(dǎo)師理查德·達(dá)芬( Richard Duffin, 1909-1996)和約翰·辛格( John L. Synge, 1897-1995)都力薦他選擇普林斯頓大學(xué),其中一位甚至稱他為“小高斯”,認(rèn)為普林斯頓是“純數(shù)學(xué)(拓?fù)鋵W(xué)、代數(shù)學(xué)和數(shù)論)家的搖籃”,與他完美契合 (納薩爾, 1998) 。
而普林斯頓這邊,數(shù)學(xué)系主席所羅門·萊夫謝茨( Solomon Lefschetz,1884-1972 )同樣渴望說服納什,最終開出了每年1 150(相當(dāng)于2021年的13 200)美金的肯尼迪獎(jiǎng)學(xué)金:
我們喜歡把握住有前途的人,趁他們還年輕、思想開放。
——萊夫謝茨給納什的一封信
納什在獲得諾貝爾獎(jiǎng)的自述中提到,靠近自己的家鄉(xiāng)布魯菲爾德也是選擇普林斯頓大學(xué)的因素之一。于是由于種種原因,納什在1948年的夏天離開了新澤西,帶著卡耐基導(dǎo)師的鼓勵(lì)和萊夫謝茨個(gè)人的強(qiáng)烈歡迎,選擇了普林斯頓大學(xué)。
達(dá)芬給萊夫謝茨的推薦信里只有一句描述納什能力的話,后來變得非常有名:
他是一個(gè)數(shù)學(xué)天才。
下面展示了達(dá)芬和辛格的推薦信:

左:納什在卡耐基理工的論文導(dǎo)師達(dá)芬寫的推薦信,寄至普林斯頓大學(xué)的所羅門·萊夫謝茨教授;右:任卡耐基理工數(shù)學(xué)系主任的辛格寫的推薦信(圖源:Princeton University Archives )
普林斯頓大學(xué)就讀時(shí)期(1948-1951)
納什20歲離開家鄉(xiāng)赴卡耐基上大學(xué)時(shí),普林斯頓數(shù)學(xué)系充斥著聰慧的頭腦,系主任萊夫謝茨和拉夫·福克斯(Ralph Fox,1913-1973)、諾曼·斯廷羅德(Norman Steenrod,1910-1971)帶頭在美國首先開展拓?fù)鋵W(xué)研究;埃米爾·阿廷(Emil Artin,1898-1962)主攻代數(shù);而萊夫謝茨的學(xué)生塔克(Albert W. Tucker,1905-1995)則主攻博弈論,這個(gè)學(xué)科在1944年馮·諾依曼(John von Neumann,1903-1957)和經(jīng)濟(jì)學(xué)家摩根斯特恩(Oskar Morgenstern,1902-1977)出版《博弈論與經(jīng)濟(jì)行為》一書后才剛剛興起。
普林斯頓大學(xué)的數(shù)學(xué)系位于名為Fine Hall(直譯為“好樓”)的大樓中,是40-50年代數(shù)學(xué)圈內(nèi)傳奇的代名詞。如納薩爾(Sylvia Nasar)在1998年所描述的:
(如一位歐洲裔所說,)我想Fine Hall是用于數(shù)學(xué)研究的最豪華的建筑,是一個(gè)可以去度假的數(shù)學(xué)鄉(xiāng)村俱樂部。
它的基石由維布倫(Oswald Veblen)設(shè)計(jì),裝有著普林斯頓數(shù)學(xué)家們工作的副本和業(yè)內(nèi)一些常用工具的鉛盒:兩只鉛筆、一段粉筆,當(dāng)然,還有一塊橡皮。
“它代表數(shù)學(xué)家們‘賴著不走’的圣所,暗色石頭所包圍構(gòu)成的走廊既適合獨(dú)自散步,也適合‘?dāng)?shù)學(xué)社交’。為高級(jí)教授準(zhǔn)備的九個(gè)書房——注意不是辦公室——有著雕刻的石板、隱藏式櫥柜、黑板、東方地毯和厚重的軟墊家具?!?/p>
“每個(gè)辦公室都配有電話、盥洗室都配有閱讀燈;三樓庫存豐富的圖書館全天開放,擁有世界上最豐富的數(shù)學(xué)期刊和書籍;愛好網(wǎng)球的數(shù)學(xué)家們?cè)诨剞k公室前無需再回家一趟(附近有個(gè)網(wǎng)球場),因?yàn)樗O(shè)有淋浴的更衣室?!?/p>
——納薩爾《美麗心靈》(1998)
納什當(dāng)時(shí)是一個(gè)由塔克領(lǐng)導(dǎo)的推進(jìn)初期博弈論發(fā)展的學(xué)派成員之一,他們從純數(shù)學(xué)意義出發(fā),基本不關(guān)心研究內(nèi)容在現(xiàn)實(shí)世界中的應(yīng)用。據(jù)經(jīng)濟(jì)學(xué)家、納什的好朋友、摩根斯特恩的學(xué)生舒比克(Martin Shubik,1926-2018)所說:
當(dāng)時(shí)數(shù)學(xué)系的學(xué)生和職工都沉浸在研究博弈論的幸福中,完全沒有意識(shí)到經(jīng)濟(jì)學(xué)系對(duì)此的態(tài)度,當(dāng)然他們即使知道,也不會(huì)關(guān)心。在普林斯頓沒待多久,經(jīng)濟(jì)學(xué)系和數(shù)學(xué)系之間鮮明不同的態(tài)度就根植在我心里了。經(jīng)濟(jì)學(xué)系有一種培養(yǎng)常規(guī)博士工廠、一切照舊的保守主義氛圍,其中不乏明星但毫無激情和挑戰(zhàn)可言;而后者則被靈感和狩獵的純粹樂趣所點(diǎn)亮。從心理學(xué)上來說,他們好像來自于不同的星球。如果在下午茶時(shí)間,一個(gè)光著腳、穿著破爛牛仔褲的十歲大的流浪小孩帶著一個(gè)非常有趣的理論走進(jìn)Fine Hall,那一定會(huì)有人去聽;但當(dāng)馮·諾伊曼進(jìn)行有關(guān)增長模型的研討會(huì)時(shí),除了少數(shù)幾個(gè)例外,普林斯頓那一大群經(jīng)濟(jì)學(xué)家肯定會(huì)無聊到只打哈欠。
——舒比克(參考 Düppe and Weintraub, Finding Equilibrium* , 2014 p. 94)
而學(xué)派的領(lǐng)導(dǎo)人塔克,則繼續(xù)指導(dǎo)普林斯頓未來的頂級(jí)博弈論學(xué)家,包括大衛(wèi)·戈?duì)枺―avid Gale,1921-2008)、2012年諾貝爾獎(jiǎng)獲得者羅伊德·沙普利(Lloyd Shapley,1923-2016),當(dāng)然,還有納什。
議價(jià)問題(1949)
在研究納什均衡以前,納什發(fā)表了他第一篇期刊論文——同樣關(guān)于博弈論,將經(jīng)典經(jīng)濟(jì)學(xué)問題視為議價(jià)過程。此前已經(jīng)有不少學(xué)者(包括Cournot、Bowley、Fellner等人)從包括雙邊壟斷調(diào)查等不同角度,對(duì)這個(gè)問題進(jìn)行過研究。

左:學(xué)生時(shí)期的納什;右:納什1950年的論文《議價(jià)問題》( The Bargaining Problem. Econometrica 18(2), pp. 155-162. )
納什的文章描述了這樣一種議價(jià)的情況:兩個(gè)人都有機(jī)會(huì)互惠互利,但是沒有一方可以在未經(jīng)允許的情況下單方面影響另一方的牟利。類似于經(jīng)典的“劃分選擇協(xié)議”的情況:兩個(gè)人需要公平地分配一個(gè)蛋糕,那么其中一個(gè)人切蛋糕,另一個(gè)人可以優(yōu)先決定自己想要哪一份,這就是無嫉妒蛋糕分配機(jī)制。
納什的論文就是基于這樣的議價(jià)情況進(jìn)行理論分析,同時(shí)在特定條件或其他“理想化條件下”給出確定的“解”,即確定滿足個(gè)體期望的收益。這樣的理想化條件包括:假設(shè)兩個(gè)個(gè)體是理性的,并可以對(duì)各種物品有著精確的偏好感知,具有相同的議價(jià)能力,以及完全了解對(duì)方的偏好信息。
納什的解法采用了從馮·諾伊曼和摩根斯特恩的書中發(fā)展出的效用的概念,也使用了期望的概念定義不同玩家在給定策略下認(rèn)可的收益。在納什的文章中,他假設(shè)有一個(gè)人小明,知道自己第二天會(huì)獲得一百塊錢,那么可以說他有“一百塊的期望”;類似地,他也可以有“兩百塊的期望”。如果他知道,次日會(huì)通過拋一枚公平的硬幣來決定他獲得一百還是兩百,那么可以說他有“50%一百和50%兩百”的期望。
對(duì)于在這種情形下的單個(gè)個(gè)體效用理論,納什提供了充分的假設(shè),并對(duì)他在1944年發(fā)表的論文《博弈論與經(jīng)濟(jì)行為》中提出的情形進(jìn)行區(qū)分。他認(rèn)為,論文中并未分別對(duì)每個(gè)人參與博弈的價(jià)值進(jìn)行估算,除非這個(gè)博弈是零和的()。于是對(duì)于雙人的非零和博弈,納什對(duì)參與玩家的預(yù)期值進(jìn)行了推導(dǎo):
首先定義一個(gè)雙人期望值為兩個(gè)單人期望值的某種組合:如果有兩位玩家,各自對(duì)未來的情形有準(zhǔn)確的期望,且單人期望值可以構(gòu)成雙人期望,那么單人效用函數(shù)可以用于求雙人效用函數(shù)的期望值。這樣如果有兩位玩家,各自對(duì)未來的情形有準(zhǔn)確的期望,且單人期望值是構(gòu)成雙人期望的元素,那么我們可以將單人的效用函數(shù)以及各自的概率用于求雙人的期望值:
如果 [A, B]代表一個(gè)雙人期望,且 0 ≤ p ≤ 1,那么 p[A,B] + (1 - p)[C,D]= [pA + (1-p)C, pB + (1-p)D]。
納什定義了兩個(gè)個(gè)體的效用函數(shù)為?和?,且將 c(S) 定義為包含原點(diǎn)的緊凸集合?S 內(nèi)的解點(diǎn)。首先他提出了一些必要的假設(shè),保證?最大時(shí)的解落在第一象限:集合的緊性保證解存在,而凸性保證解唯一。

圖1 來自納什的論文《議價(jià)問題》,示意了玩家1和玩家2的效用集合S中唯一最優(yōu)點(diǎn)。
議價(jià)問題實(shí)例(納什,1950)
假設(shè)小明和小紅兩個(gè)很聰明的人,他們手上只有可以交換的貨物,但是沒有錢用來找零。為了簡單起見,再假設(shè)一個(gè)人獲得所有物品的效用是這部分中各貨品對(duì)他的效用之和。下面的表格列出了每個(gè)物品的所屬權(quán)和對(duì)每個(gè)人的效用,兩個(gè)個(gè)人的效用函數(shù)單位是任意的。
小明擁有的貨品:
小紅擁有的貨品:
這個(gè)議價(jià)問題的圖像是一個(gè)凸多邊形,其中效用乘積最大的點(diǎn)在一個(gè)頂點(diǎn)上,對(duì)應(yīng)著唯一一個(gè)預(yù)期,其中:
小明給小紅:書、鞭子、小球和球拍;
小紅給小明:鋼筆、玩具和小刀。
納什在論文中對(duì)此議價(jià)問題進(jìn)行的作圖

實(shí)例:解點(diǎn)位于第一象限、矩形雙曲線與可選集合的唯一切點(diǎn)上。
目前我們還不清楚納什如何得出這樣結(jié)果的過程,他要好的朋友,出版于2002年的納什傳記《 The Essential John Nash 》的作者之一——庫恩(Harold Kuhn,1925-2014)回憶這篇論文時(shí)說:
我記得(這篇文章)在納什畢業(yè)后的第一年就送到了馮·諾伊曼手中,納什當(dāng)時(shí)還提醒了馮·諾伊曼(這篇文章的)存在。如此看來,這篇文章應(yīng)該是納什還在卡耐基理工時(shí)上的唯一一門經(jīng)濟(jì)學(xué)選修課的課程論文。
但他補(bǔ)充道:
納什的記憶與我有出入,他在1995年某次和羅杰·梅耶森的午餐中說到,他是到了普林斯頓之后才寫的這篇論文。無論這篇文章的真實(shí)歷史如何,其中的舉例暗示寫作的是個(gè)年輕人,因?yàn)槲锲钒ㄇ蚺?、球或是鋼筆小刀之類的東西??梢源_定的是,當(dāng)時(shí)納什還從未讀過論文引文部分所提到的古諾、鮑利、廷特納以及費(fèi)爾納的工作。
—— 庫恩
納什20歲時(shí)到了普林斯頓大學(xué),終于在1950年的時(shí)候在著名期刊《計(jì)量經(jīng)濟(jì)學(xué)》上發(fā)表了自己的論文《議價(jià)問題》:
Nash (1950). The Bargaining Problem. Econometrica 18(2), pp. 155-162.
與馮·諾依曼的交流
盡管納什的推論在某種程度上與馮·諾伊曼和摩根斯特恩關(guān)于合作博弈論的工作相反,但他為非合作博弈理論打下的基礎(chǔ)顯然來源于前人工作。也因?yàn)槭艿搅诉@樣的啟發(fā),納什發(fā)現(xiàn)了納什均衡, 得以在1978年獲得約翰·馮·諾伊曼理論獎(jiǎng)。
現(xiàn)存的文件中只找到了一份記載納什和馮·諾伊曼之間的交流,可以肯定的是其余多數(shù)都已經(jīng)隨著時(shí)間而丟失了。據(jù)納薩爾回憶,納什在1949年普林斯頓統(tǒng)考后沒幾天就與馮·諾伊曼進(jìn)行了談話——在他發(fā)現(xiàn)納什均衡之前:
當(dāng)時(shí)他驕傲地告訴秘書,他準(zhǔn)備和馮·諾伊曼教授討論一個(gè)能激起他興趣的想法。對(duì)于一個(gè)研究生來說,這是件相當(dāng)大膽的事情。
…這當(dāng)然像是納什會(huì)做出的事情,畢竟他前一年還帶著一個(gè)想法去見了愛因斯坦… 他聽得很認(rèn)真,輕敲著手指,時(shí)不時(shí)還偏一偏頭。納什開始描述腦海中對(duì)超過兩位玩家博弈的均衡的證明。
馮·諾伊曼在他說出更多雜亂的句子以前打斷了他,突然對(duì)納什未下定論的闡述說:“這沒什么意思,只是個(gè)不動(dòng)點(diǎn)理論罷了。”
——納薩爾《美麗心靈》 (1998)
看起來馮·諾伊曼并沒有在納什討論的非合作博弈論的概念中看到價(jià)值,但納什隨后便在給歷史學(xué)家羅伯特·萊納德的信中為這位偉人的反應(yīng)辯護(hù),他分析道:
我當(dāng)時(shí)在和馮·諾伊曼進(jìn)行一場非合作博弈,而不只是尋求加入他的聯(lián)盟;顯然從心理學(xué)上說他不會(huì)對(duì)一個(gè)競爭的理論完全滿意。
雖然如此,馮·諾伊曼和摩根斯特恩最終都給予了納什有價(jià)值的指導(dǎo),在納什發(fā)表的論文中,對(duì)兩人都進(jìn)行了致謝:
作者希望感謝馮·諾伊曼和摩根斯特恩教授的幫助,他們?cè)陂喿x完論文的初稿后都提供了非常有幫助的建議。
參考文獻(xiàn)
? Düppe, T. & Weintraub, E.R. 2014. Finding Equilibrium*. Princeton University Press.
? Nasar, S. 1998. A Beautiful Mind. Simon & Schuster.
? Nash, J. F. 1950. The Bargaining Problem. Econometrica 18(2), pp. 155-162.
? von Neumann, J. & Morgenstern, O. 1944. Theory of Games and Economic Behavior. Princeton University Press.
作者:J?rgen Veisdal
翻譯:zhenni
審校:藏癡
原文鏈接:Nash's Bargaining Problem (1950)