最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

優(yōu)思學院|神奇的統(tǒng)計:從諸葛亮草船借箭說起

2022-04-11 12:12 作者:優(yōu)思學院  | 我要投稿


在抽象的意義下,一切科學都是數(shù)學;在理性的世界里,所有的判斷都是統(tǒng)計學。─C. R. 勞

從城邦政情到統(tǒng)計學

統(tǒng)計學是透過搜集、整理、分析、描述資料等手段,以推斷所測量物的性質(zhì)、本質(zhì)乃至未來的一門學科,需要運用許多數(shù)學知識。統(tǒng)計起源于何時何地已經(jīng)很難說清,有人說是古埃及,有人說是古巴比倫,也有史料記載是西元前二千年左右的夏朝,統(tǒng)治者為了征兵和征稅而進行了人口統(tǒng)計。

到了周朝,“司書”一職首次在中國歷史上出現(xiàn),相當于今日的行政院主計總處處長。西方最早關(guān)于統(tǒng)計的記載則是《圣經(jīng).舊約》,引用了猶太人的人口統(tǒng)計結(jié)果。

人口統(tǒng)計若僅僅是小范圍的,即使包括了人數(shù)、年齡、收入、性別、身高、體重等多項指標,也派不上大用場。隨著統(tǒng)計人數(shù)的增加,例如一座城市的市民、一整個省的女性,以及統(tǒng)計指標的增加,例如健康狀況、家庭經(jīng)濟狀況和壽命等,才能逐漸體現(xiàn)出統(tǒng)計的規(guī)律和價值。

西元前四世紀,亞里斯多德撰寫的“城邦政情”(matters of state)共包含了一百五十余種紀要,內(nèi)容涉及希臘各個城邦的歷史、行政、科學、藝術(shù)、人口、資源和財富等社會和經(jīng)濟情況及其比較分析。

“城邦政情”式的統(tǒng)計延續(xù)了二千多年,直至十七世紀中葉才逐漸被“政治算術(shù)”(political arithmetic)這個頗有意味的名稱替代,并且很快演化為“統(tǒng)計學”(statistics)。最初,它只是一個德文詞匯 statistik,保留了城邦(state)的詞根,本義是研究國家和社會狀況的數(shù)量關(guān)系。后來,歐洲各國相繼翻譯,法文為 statistique,義大利文為 statistica,然后是英文。

值得一提的是,英語中的統(tǒng)計學家和統(tǒng)計員是同一個字,正如數(shù)學家和數(shù)學工作者是同一個單詞一樣。日語最初把“統(tǒng)計學”譯為“政表”、“政算”、“國勢”、“形勢”,一八八○年才確定為“統(tǒng)計”。一九○三年,橫山雅南的著作《統(tǒng)計講義錄》被譯成中文出版,“統(tǒng)計”一詞也從日本傳到了中國,與“數(shù)學”這個詞語的來歷相同。

既然統(tǒng)計學的主要工作是與資料打交道,資料通常又有隨機性,就涉及了另外一個統(tǒng)計學術(shù)語─概率。隨機意味著不確定性,但也并非沒有規(guī)律可循,這時就需要用概率來描述。例如,經(jīng)驗告訴我們,投擲硬幣出現(xiàn)正面朝上結(jié)果的概率約為1/2,投擲骰子結(jié)果為六點的概率是1/6。

更多時候,我們需要進行大規(guī)模的統(tǒng)計才能知道一件事發(fā)生的概率。例如某航班的準點率、某地某日的降水概率。而我們在透過計算獲得概率的同時,也掌握了相應的統(tǒng)計規(guī)律。不過,統(tǒng)計與概率是有差異的。計算一個有四十位學生的班級是否有人同一天生日的概率,與具體統(tǒng)計他們的生日,兩者并不一樣,而且不同班級(即便人數(shù)相同)的統(tǒng)計結(jié)果也不相同。

草船借箭可有其事?

如同腳踏車的發(fā)明使得人們擴大了交流范圍,弓箭的發(fā)明也拓寬了人們的活動范圍。有了弓箭,人類便可走出山洞,離開茂密的森林,在廣闊的丘陵或平原安家。弓箭不但增強人們的安全防御能力,也幫助他們獲取更多獵物,為人類的繁衍創(chuàng)造良好的物質(zhì)條件。

弓箭大約誕生于三萬年前的舊石器時代晚期,它是冷兵器時代最可怕的致命武器。弓箭由弓和箭兩部分組成,其中的弓由有彈性的臂和有韌性的弦構(gòu)成;箭則包括了箭頭、箭桿和箭羽,箭頭為銅或鐵制,桿為竹或木質(zhì),羽為鵰或鷹的羽毛。射手拉弓時,手指上還有保護工具。

恩格斯(Friedrich Engels)說過,“弓、弦、箭已經(jīng)是很復雜的工具,發(fā)明這些工具需要長期積累的經(jīng)驗和較為發(fā)達的智力?!惫陌l(fā)明或許與音樂的起源有某種關(guān)系,二十世紀英國科學史家 J.D.貝爾納(J. D. Bernal)認為,“弓弦彈出的汪汪粗音可能是弦樂器的起源”。

在《詩經(jīng).小雅》里有一首詩寫到了“角弓”,即弓箭。這首詩勸告周王不要疏遠兄弟親戚而親近小人,為民眾做出表率。首章四句是:“骍骍角弓,翩其反矣。兄弟昏姻,無胥遠矣?!斌U骍指的是弦和弓調(diào)和的樣子,翩是彎曲,昏姻即婚姻或姻親,意為“把角弓調(diào)和繃緊弦,弦松弛的話會轉(zhuǎn)向。兄弟姻親是一家人,相互親愛可別疏遠”。

中國古代神話有“后羿射日”的故事。古典小說里一方面有許多神箭手,例如呂布轅門射戟、薛仁貴三箭定天下、養(yǎng)由基百步穿楊等,另一方面,打不贏就放箭的例子同樣比比皆是,清代如蓮居士的傳奇小說《說唐》里的羅成武藝高強,最終卻陷于淤泥并死于亂箭。

一般士兵的射術(shù)可沒有神箭手那么精準。假設(shè)單次射中目標的概率為 0.1,沒射中的概率就是 0.9,連續(xù)兩次射不中的概率為 0.9×0.9=0.81。依此類推,一百次都射不中的概率為 0.9100≈0.00003,那么至少射中一次的概率為“1–0.00003=99.997%”。

即便要求至少射中目標三次,概率仍高達 98.41%。由此可見,與其費力去找神箭手,不如讓一百名士兵亂箭齊發(fā),效果更好。在羅貫中的歷史小說《三國演義》里,長坂坡(今湖北荊門)一役成就了趙子龍的傳奇,其實曹操下令不許放箭可能也發(fā)揮了不可或缺的作用。

再來看諸葛亮草船借箭,傳說中取到了十萬支箭。依據(jù)羅貫中的描述,當時江上大霧彌漫,士兵放箭基本上是聞聲尋的,命中概率估計不到 0.1,中間還要調(diào)轉(zhuǎn)船身,用另一面接箭,自然會射空。即便射中概率不變,至少也需要射一百萬支箭。當時曹操的弓箭手僅一萬名,代表每人需射一百支,但專家分析這不太可能,因為古時一個箭壺通常只裝二十到三十支箭。

高斯的常態(tài)分布曲線

生活中偶有小機率事件發(fā)生。例如,據(jù)相關(guān)統(tǒng)計,飛機失事的機率約為三百萬分之一。這個機率聽起來很小,但每天都有無數(shù)乘客搭乘飛機,全世界的航班累計數(shù)量其實頗為驚人,因此偶爾還是會聽到飛機失事的消息。

再看另一個例子,二○一○年南非世界杯足球賽期間,生于英國養(yǎng)于德國的“章魚帝保羅”成為耀眼的明星。保羅八次預測,全部猜對比賽結(jié)果,尤其是西班牙戰(zhàn)勝荷蘭的那場決賽,更讓全世界球迷為之側(cè)目。假如沒有人為操縱,保羅猜對一次的機率是 0.5,連續(xù)八次猜對的機率是 0.0039。我們只能說,小機率事件又一次發(fā)生了。

在統(tǒng)計學中,樣本的選取也存在小機率事件。例如,從一個裝著紅球和藍球的缸中隨機拿出球來,哪怕缸中的球多半是紅球,取出的樣本仍可能是藍球占多數(shù),由此導出錯誤的結(jié)論:缸中的球多數(shù)是藍色的。有鑒于此,統(tǒng)計學家想了一個辦法來提高由樣本推斷總體特征的能力。

假設(shè)有一個裝了非常多球的缸,其中紅球、藍球的比例為P:(1–P),P(P≦1)是某個未知的比例。一次從缸中拿出五個球,這是一個樣本。設(shè)p是所有樣本(每個樣本均含五個球)中紅球比藍球多(即至少有三個紅球)的樣本所占比例(p≦1)。根據(jù)機率理論,可得 P 和 p 的關(guān)系如下:

P 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

p 0.01 0.06 0.16 0.32 0.50 0.68 0.84 0.94 0.99

這就說明,當缸中紅球比例為 0.1 時,在抽取的樣本中紅球占多數(shù)的樣本比例是很小的。確切地說,在一百個樣本中,可能只有一個樣本是如此。

如果只是加減和方冪運算,統(tǒng)計學恐怕成不了一門學科,更無法成為與數(shù)學并列的一級學科(機率理論是數(shù)學下面的二級學科)。幸好,統(tǒng)計學里還有高斯的常態(tài)分布理論。

十九世紀下半葉,英國統(tǒng)計學家高爾頓(Francis Galton)和皮爾遜(Karl Pearson)在研究父母身高與子女身高之間的遺傳關(guān)系時,發(fā)現(xiàn)了朝平均數(shù)回歸的現(xiàn)象,也就是身高不會兩極分化。

高爾頓做了著名的釘板實驗,他在一塊平整的木板上均勻放置了二十排釘子,下排的每根釘子恰好位于上排兩根釘子的中間。然后他讓一顆小圓球從最頂層中間處滾下來,小圓球碰到釘子后往左或往右滾落的概率各為 0.5。由于釘子的間距正好略大于小圓球的直徑,小圓球會再次撞擊釘子并往左右滾落,概率同樣為 0.5。

高爾頓觀察到,小圓球雖然一路碰撞滾落底部,卻不會太偏離中心位置。大多數(shù)小圓球都集結(jié)在底部中心的位置,愈往兩邊數(shù)量愈少。最后,堆積的小圓球形成了一個鐘形曲線,這正是由法裔英籍數(shù)學家棣美弗(Abraham de Moivre)于一七三三年提出,后以德國數(shù)學家高斯(他首先將其應用于天文學研究)的名字來命名的常態(tài)分布曲線:


如果考慮滾落在中間6個釘距之間的小圓球,則其概率為上述函數(shù)在區(qū)間[–3, 3]上的定積分,大約是 99.73%。莎士比亞的詩文和忌日威廉?莎士比亞(W. Shakespeare)是英國大文豪,也被視為有史以來最偉大的文學家之一。 1985年秋天,有位莎翁研究專家在牛津大如果考慮滾落在中間六個釘距之間的小圓球,則其機率為上述函數(shù)在區(qū)間[–3, 3]上的定積分,大約是99.73%。



莎士比亞的詩文和忌日

莎士比亞是英國大文豪,被視為有史以來最偉大的文學家之一。一九八五年秋天,某位莎翁研究專家在牛津大學博多利圖書館里發(fā)現(xiàn)了一首寫在紙片上的九節(jié)詩。這張紙片已被收藏近二百年,上面的詩歌會是莎翁寫的嗎?

兩年后,兩位統(tǒng)計學家研究了這首詩,并與莎士比亞的寫作風格進行比對,結(jié)果發(fā)現(xiàn)它們驚人的一致性。已知莎翁詩文著作中用詞總量為 884,647 個,其中 31,534 個是不同的,它們出現(xiàn)的頻率如下:

單詞使用的頻率 1 2 3 4 5 >100

不同的單詞數(shù) 14376 4343 2292 1463 1043 846

由此可見,莎翁喜歡用新詞,他使用一次就舍棄的詞高達 45.6%,僅用兩次的詞占 13.8%。倘若對莎翁的部分作品做同樣的統(tǒng)計,不同的詞出現(xiàn)的頻率會高一些。這首新發(fā)現(xiàn)的詩作共有四百二十九個單詞,其中有二百五十八個是不同的,觀測值與基于莎翁寫作風格的預測值相對接近。與此同時,統(tǒng)計學家也調(diào)查了與莎翁同時代的著名詩人詹森(S. Johnson)、馬婁(C. Marlowe)和鄧恩(J. Donne)的寫作風格,發(fā)現(xiàn)他們的預測值與這首詩的觀測值有著統(tǒng)計學上的顯著差異。

自此以后,莎士比亞的另外三部著作《羅密歐與茱麗葉》、《湯瑪斯.莫爾爵士》和《愛德華三世》也用同樣的方法加以驗證。因為《羅密歐與茱麗葉》寫的是義大利上流社會,而莎翁出身英國平民,過去三個世紀里,包括狄更斯(Charles Dickens)和馬克.吐溫(Mark Twain)等人都曾懷疑它不是莎士比亞的作品。

蘇聯(lián)作家蕭洛霍夫(Mikhail Sholokhov)的傳世之作《靜靜的頓河》(And Quiet Flows the Don)也曾遭受類似質(zhì)疑。這部小說讓蕭洛霍夫獲得一九六五年的諾貝爾文學獎。一九七四年,另一位流亡的蘇聯(lián)作家索忍尼辛(Aleksandr Solzhenitsyn,一九七○年諾貝爾獎得主)在巴黎公開提出質(zhì)疑,主張蕭洛霍夫當時才二十多歲,不可能寫出如此廣度和深度的鴻篇鉅著,而且書中的內(nèi)容和寫作技巧也不平均。

這場爭論一直持續(xù)到蕭洛霍夫暮年,有人懷疑他抄襲了已故作家克留科夫(F. Kryukov)的作品。一九八四年,一位挪威奧斯陸大學的統(tǒng)計學家率領(lǐng)了一個小組,將蕭洛霍夫無爭議的作品、《靜靜的頓河》和克留科夫的作品分為三組,利用統(tǒng)計方法進行分析。

第一,他們統(tǒng)計不同詞匯占總詞匯量的比例,三組分別為 65.5%、64.6%、58.9%。第二,選擇最常見的二十個俄語單詞,統(tǒng)計它們出現(xiàn)的頻率,三組分別為 22.8%、23.3%、26.2%。第三,統(tǒng)計出現(xiàn)不止一次的詞匯所占比例,三組分別為 80.9%、81.9%、76.9%。

無論哪一類統(tǒng)計結(jié)果都顯示,克留科夫的作品風格與《靜靜的頓河》之間存在著顯著差異,而蕭洛霍夫更像《靜靜的頓河》的作者。在中國,古典小說《紅樓夢》的作者同樣存有疑問,有紅學家認為后四十回與前八十回在風格上有很大差異,因此懷疑是另一個作者所寫。假如也使用統(tǒng)計學方法,或許可以幫助鑒別。

二十世紀印度裔美籍統(tǒng)計學家 C.R.勞(C. R. Rao)說過,“假如世上每件事情均不可預測地隨機發(fā)生,那我們的生活將無法忍受。反之,假如每件事情都是確定的、完全可以預測的,那我們的生活又將十分無趣。”他還指出,“在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學都是數(shù)學;在理性的世界里,所有的判斷都是統(tǒng)計學?!?/p>

最后再回來說說莎士比亞。莎翁的生日與忌日都是四月二十三日,這一天也是西班牙語世界最偉大的作家、《唐吉訶德》作者塞萬提斯(Cervantes)的忌日,他們在一六一六年的同一天去世。中國歷史上最負盛名的戲劇家之一湯顯祖也在這一年去世。這個機率實在太小了,小到我們無法估測,甚至完全可以忽略不計。

【本文節(jié)錄自《數(shù)學的故事》,時報文化出版,作者蔡天新。】


優(yōu)思學院|神奇的統(tǒng)計:從諸葛亮草船借箭說起的評論 (共 條)

分享到微博請遵守國家法律
乌苏市| 那曲县| 屏东县| 盈江县| 榆树市| 海林市| 泸定县| 本溪| 鸡东县| 和田县| 铜川市| 东辽县| 神农架林区| 锡林浩特市| 苏州市| 石家庄市| 太湖县| 元谋县| 荃湾区| 化德县| 安义县| 嘉兴市| 新宾| 永吉县| 九江市| 新巴尔虎左旗| 临沂市| 上犹县| 宣武区| 河北省| 青龙| 比如县| 东乌| 天气| 民丰县| 册亨县| 商水县| 克山县| 西充县| 青岛市| 南华县|