巴黎高師數(shù)學博士洛奈:為什么世界是乘法的?
1938 年 3 月,美國工程師和物理學家弗蘭克·本福特(Frank Benford)發(fā)表了《反常數(shù)定律》(“The Law of Anomalous Numbers”)一文,他在這篇文章中分析了來自兩萬多個不同觀察源的數(shù)字數(shù)據(jù)。
在他的列表中,我們可以看到世界各地河流的長度、美國不同城市的人口、已知原子質(zhì)量的測定值、新聞報紙上隨機獲取的數(shù)字,甚至還有數(shù)學常數(shù)。對于所有這些數(shù)據(jù),本福特每次得到的觀察結(jié)果都和我們的一樣:首位數(shù)字分布不均衡。這條定律的影響之大,能讓我們在毫無意識的情況下不斷地復(fù)現(xiàn)它。
走進弗蘭克·本福特剛剛為我們打開的世界游逛一圈,等你從中出來的時候不可能還是原來的樣子。本福特定律改變了你。一旦你理解了它,你就再也不會以同樣的方式思考了。
如果你有一臺舊計算機,它因為多年的頻繁使用而變得破舊,那么你可能會注意到鍵盤上鍵帽的破舊程度并不完全相同。E 鍵和空格鍵通常老化得更厲害,不像 $ 鍵或 ù 鍵,經(jīng)過多年的使用之后看起來依然很新。
這一點兒也不奇怪。有些鍵是最常用的鍵,對應(yīng)法語中最常出現(xiàn)的字母。在一份沒有特殊風格的普通文本中,E 占去了所用字母中的15.87%,約為僅占 0.24% 的字母 Y 的 66 倍。我們可以在售賣備用部件的網(wǎng)店買到單個的替換鍵帽。你會毫不意外地看到,銷售量最高的替換鍵帽是 E 鍵,A 鍵和 N 鍵緊隨其后。
這種使用不均的現(xiàn)象存在于不同的領(lǐng)域之中。彈吉他的人會看到,琴弦因自己彈奏曲目中和弦使用頻率的高低而出現(xiàn)不同程度的磨損。通往較高樓層的電梯按鈕通常會磨損得更厲害,因為一樓或二樓的住戶會更常選擇走樓梯。絕大多數(shù)四色圓珠筆在被丟棄的時候,綠色和紅色的筆芯仍然是滿的——藍色和黑色最先用完。
出于同一效應(yīng),過去幾個世紀的科學家發(fā)現(xiàn),他們所用對數(shù)表的最前面幾頁,無一例外要比最后幾頁磨損得更快。換言之,以 1、2 或 3開頭的數(shù)被查找的頻率要高于以 7、8 或 9 開頭的數(shù),而科學家們對小的數(shù)并沒有任何有意識的偏好,這就好像是大自然親自在給予科學家去研究的數(shù)中造就了這種不平衡。
這一觀察結(jié)果本該引起科學家的注意,但很可惜,他們中的大多數(shù)人并不認為這種現(xiàn)象值得研究。倘若不去尋找顯而易見之事,人們就會很容易看不到它。在三個世紀里,本福特定律實際上就擺在世界各地科學家們的眼前,但沒有一個人看到它。
直到 19 世紀末,一只羞怯的手才開始揭開這張神秘的面紗。1881 年 12 月,加拿大裔美國天文學家和數(shù)學家西蒙·紐科姆(Simon Newcomb)發(fā)表了一篇題為《關(guān)于不同數(shù)字在自然數(shù)中使用頻率的記錄》(“Note on the Frequency of Use of the Differents Digits inNatural Numbers”)的文章。這篇發(fā)表在《美國數(shù)學雜志》(AmericanJournal Of Mathematics)上的文章只有短短兩頁。紐科姆注意到他所用對數(shù)表頁面磨損程度的不均,于是出于好奇提出了前幾個數(shù)的分布問題,并用幾行字做出了解答。
可惜的是,他的發(fā)現(xiàn)幾乎無人問津。
必須承認,這種現(xiàn)象背后的數(shù)學原理非常簡單,而且不太值得專家的關(guān)注。然而,重要的不是計算,而是這些計算告訴我們的有關(guān)這個世界的信息。1881 年,似乎沒人意識到,西蒙·紐科姆的發(fā)現(xiàn)如同把聚光燈照在宇宙背后轉(zhuǎn)動的一個巨大齒輪上。直到五十多年后,弗蘭克·本福特才意識到這一發(fā)現(xiàn)的博大之處,并為它撰寫了一篇二十來頁的文章。
盡管篇幅很短,但紐科姆的文章很有啟發(fā)性,值得我們?yōu)樗A羝?。文章的結(jié)論很簡單:世間的數(shù)是均勻分布的,而且是從乘法角度來看的均勻分布!
因此,在一張源自任意一種自然現(xiàn)象的數(shù)據(jù)列表中,介于 1 和 2 之間的數(shù)會和介于 2 和 4 之間以及介于 4 和 8 之間的數(shù)一樣多(圖 1.22)。這種現(xiàn)象僅僅是因為數(shù)與數(shù)的距離在乘法上是相等的,即從一個數(shù)到其 2 倍的數(shù)的區(qū)間。自然而然地,以 1 或 2 開頭的數(shù)就會比以 7、8或 9 開頭的數(shù)要多。

顯然,如果數(shù)中的首位數(shù)字看起來分布不均,那是因為我們沒有去看應(yīng)該看的信息:均勻分布的是這些數(shù)的對數(shù)??纯茨阍诔欣镉涗浀膬r格清單、太陽系行星的直徑,或是世界上河流的長度,然后找到它們的對數(shù)。你會發(fā)現(xiàn)以 1、2、3、4、5、6、7、8 或 9 開頭的數(shù)同樣多。納皮爾的對數(shù)成功地轉(zhuǎn)換了數(shù)的乘法分布,并將這種規(guī)律引入加法之中。
基于這一觀察結(jié)果,西蒙·紐科姆計算出首位數(shù)字應(yīng)當具有的理論分布。幸甚,幸甚!這種理論分布與弗蘭克·本福特在五十年后發(fā)現(xiàn)的真實分布奇跡般地吻合了(圖 1.23)。在理論與具體實驗的結(jié)果相符時,科學家會感到異常高興?,F(xiàn)在我們可以確信自己清楚地了解了發(fā)生的事情。

只剩下最后一個問題了。是的,這個世界青睞乘法,但為什么?為什么現(xiàn)實似乎在所有的情況下都偏愛這種分布呢?同樣地,答案并不存在于大自然中,而是存在于人類對大自然的觀察偏差之中。鑒于本福特定律所具有的普遍性,它沒有任何理由要取決于我們看待它的方式。
例如,法國的地理學家以公里為單位丈量河流,而英國的地理學家則以英里為單位丈量河流。因此,根據(jù)你的所在地是位于英吉利海峽的這一邊還是那一邊,尼羅河的長度要么是 6650 公里(以 6 開頭),要么是 4130 英里(以 4 開頭)。而世界上所有的河流,其長度的首位數(shù)字都會根據(jù)所采用的計量單位是法式的還是英式的而發(fā)生改變。有人可能會認為,這種計量單位的改變會顛覆首位數(shù)字的整體分布,讓英國學者使用對數(shù)表的方式不同于法國學者的使用方式。但情況并非如此。公里和英里都是人類的發(fā)明,而大自然并不在乎我們使用哪種計量單位去測量它。從法國或英國的角度去看,每一條被分別丈量的河流,其長度不會有相同的首位數(shù)字,但如果我們制定出世界上河流長度的完整列表,則首位數(shù)字的總體分布應(yīng)當會保持不變。
換言之,本福特定律應(yīng)該是不變的。就像美索不達米亞式乘法的結(jié)果,就算沒有零和小數(shù)點也依然會保持不變;就像字母 E 在一個足夠長的文本中所占的比例始終會是大約 15%,無論文本的內(nèi)容為何。無論我們使用什么方法去測量自然和收集數(shù)據(jù),首位數(shù)字的分布都會保持不變。
如果你打算在世界不同國家的超市里進行統(tǒng)計的話,你會發(fā)現(xiàn),本福特定律不會在乎你是以歐元、人民幣、美元還是第納爾來計算。無論使用哪種貨幣,這條定律都不會發(fā)生變化。
計量單位的改變,無論是把公里轉(zhuǎn)換成英里,還是把歐元轉(zhuǎn)換成第納爾,或是其他的單位轉(zhuǎn)換,都是一種乘法。一條河流的長度是另一條河流的兩倍,無論采用哪種計量單位,這個長度的兩倍都不會改變。一種價格比其他產(chǎn)品貴三倍的奶酪,無論使用哪種貨幣,它的價格始終都貴三倍。計量單位改變了,乘法的差距不變。因此,在任意數(shù)據(jù)列表中,我們都會發(fā)現(xiàn)介于 1 和 2、2 和 4 或 4 和 8 之間的數(shù)比例是相同的。所以,我們需要關(guān)注的是這種乘法的差距。
這就是為什么世界是乘法的。這就是為什么對數(shù)標度如此適切。這就是為什么我們的數(shù)字系統(tǒng)會不斷誤導我們的直覺。而這也是為什么本福特定律會是真實、美麗而又放之四海皆準的。

在隨后的幾年中,本福特定律在各處都得到了具體的應(yīng)用。
美國經(jīng)濟學家哈爾·瓦里安(Hal Varian)在 1972 年提出用本福特定律來檢測舞弊。原理很簡單:當舞弊者把一份數(shù)據(jù)列表篡改成利于自己的時候,他們會露出馬腳。也就是說,他們偽造的數(shù)據(jù)會有不同的首位數(shù)字分布。尤其是,偽造的數(shù)據(jù)會更頻繁地以 5 或 6 開頭,這與本福特定律不符。這或許是因為舞弊者傾向于認為,相較于以 1 或 9開頭的數(shù),一個中等大小的數(shù)看起來不會那么可疑,或是更正常。盡管如此,這種偏差仍會導致首位數(shù)字中的 5 和 6 遠遠多于應(yīng)有的數(shù)量。這種偏差的幅度可以用來估算潛在舞弊者的數(shù)量。例如,這種方法被用來追蹤稅務(wù)申報中的統(tǒng)計異常,或發(fā)現(xiàn)選舉時操縱選票的行為。
但我們必須承認:如果排除幾種不同的應(yīng)用,本福特定律在我們的日常生活中并沒有重大的影響。知道超市貨品的價格遵循這一定律很有趣,但其實沒有太大用處;知道各國的人口、世界上的河流或天空中的天體都遵循這一定律,也沒有太大用處?!皼]用處”究竟是好是壞,由你來定奪。
但是,我們因好奇而踏足的這條道路上充滿了驚喜。當然了,出于純粹的智力挑戰(zhàn),出于體驗數(shù)學的形式之美,出于讓我們的思維變得多姿多彩,不帶任何期待地去理解一件事,未必不會讓人獲得極大的滿足。然而,即便是最無用的事情,有時也會暗藏意料之外的寶藏。可不要低估了這些定理。
或許有一天,在你完全沒有想到的那一刻,“有用之處”會不期而至。它們會像成熟而甜美的果實那樣,自然而然地落入你的手中。