《思考,快與慢》中文 第十章:大數(shù)法則與小數(shù)定律

《思考,快與慢》Thinking, Fast and Slow 原文 書籍翻譯 第十章
作者:[美]丹尼爾·卡尼曼
【以下內(nèi)容為作者的正文】注:根據(jù)語意略有改動,但不影響原意。
第二部分 啟發(fā)法與偏見
第10章 大數(shù)法則與小數(shù)定律
?
一項研究對美國3141個縣的腎癌發(fā)病率進行了調(diào)查,調(diào)查顯示該病的分布模式很值得注意。發(fā)病率最低的縣差不多都位于中西部、南部和西部人口稀少的鄉(xiāng)村,這些區(qū)域按照慣例由共和黨管轄。對此,你有何看法?
?
剛剛過去的幾秒鐘里,你的大腦處于非?;钴S的狀態(tài),這主要是因為系統(tǒng)2在運行。你謹慎地在記憶中搜尋著并作出假設(shè)。在這個過程中你也付出了一定的努力,你的瞳孔會擴張,心跳會適度加快。系統(tǒng)1也沒有閑著,因為系統(tǒng)2的運行需要從聯(lián)想記憶中獲取事實和建議。你很可能會否認共和黨的政策提供了腎癌防控方法這個想法,卻會關(guān)注腎癌發(fā)病率低的縣大多是鄉(xiāng)村這個事實。這個例子是我從機智的統(tǒng)計學(xué)家霍華德·維納(Howard Wainer)和哈里斯·澤維林(Harris Zwerling)那兒得到的,他們對這一案例的評論是:“人們很容易作出推斷,認為腎癌發(fā)病率低主要是由于鄉(xiāng)村的生活方式很健康—沒有空氣污染和水污染,食品沒有添加劑,保證新鮮。”這一點完全說得通。
?
現(xiàn)在,考慮一下腎癌發(fā)病率最高的縣的情況吧。假設(shè)這些易發(fā)病的縣差不多都位于中西部、南部和西部人口稀少的鄉(xiāng)村,這些區(qū)域按照慣例由共和黨管轄?;羧A德·維納和哈里斯·澤維林半開玩笑地評論道:“人們可以很容易作出推斷,導(dǎo)致腎癌高發(fā)病率的直接原因是鄉(xiāng)村生活的貧困—醫(yī)療條件差、高脂肪飲食、酗酒、嗜煙等。”當(dāng)然這種說法肯定有問題,因為鄉(xiāng)村生活方式不可能既是腎癌發(fā)病率高的原因又是其發(fā)病率低的原因。
?
問題的關(guān)鍵并不在于這些縣處在鄉(xiāng)村地區(qū)或是由共和黨掌管,而在于鄉(xiāng)村地區(qū)人口少。我們通過這個例子學(xué)到的不是流行病學(xué)知識,而是我們的大腦和統(tǒng)計數(shù)據(jù)之間的復(fù)雜關(guān)系。系統(tǒng)1非常擅長一種思維模式—自動且毫不費力地識別事物之間的因果聯(lián)系,即使有時這種關(guān)系根本就不存在,它也會這樣認定。當(dāng)聽到腎癌高發(fā)地區(qū)的情況時,你立刻會想當(dāng)然地認為這些縣與其他縣不同是有原因的,一定有個理由可以解釋這種不同。然而,正如我們所見,當(dāng)系統(tǒng)1面對“純統(tǒng)計學(xué)”的數(shù)據(jù)時是束手無策的,因為這些數(shù)據(jù)雖然可以改變結(jié)果出現(xiàn)的概率,卻不能直接導(dǎo)致結(jié)果的發(fā)生。
?
根據(jù)定義,一個隨機事件是不需要解釋的,但一連串的隨機事件就有規(guī)律可循。想象有一個裝有大理石彈球的甕,其中有一半的彈球是紅色的,另一半彈球是白色的。然后,再想象有一個非常有耐心的人(或一個機器人)隨意從甕中取出4個大理石球,記錄其中的紅球數(shù),再把球放回去,重復(fù)這樣的做法數(shù)次??偨Y(jié)記錄結(jié)果時,你會發(fā)現(xiàn)“2紅2白”的結(jié)果出現(xiàn)的次數(shù)(幾乎剛好)是“4個全紅”或“4個全白”這種結(jié)果的6倍。這一倍數(shù)關(guān)系是個數(shù)學(xué)事實。你可以對這種從甕中反復(fù)抽樣的結(jié)果作出自信的預(yù)測,就像你能預(yù)測到用錘子砸雞蛋的結(jié)果一樣。盡管你無法預(yù)見蛋殼破碎的具體細節(jié),但大概結(jié)果還是很確定的。兩件事的不同之處在于:你想到錘子砸雞蛋時感受到的那種明確的因果聯(lián)系,在甕中取樣的設(shè)想中是找不到的。
?
相關(guān)的統(tǒng)計學(xué)事實與癌癥那個例子也有聯(lián)系。兩個耐心的計數(shù)者輪流從甕中取大理石球,杰克每次拿出4個球,吉爾拿出7個。他們都記錄了每次拿到相同顏色彈球的次數(shù)—要么全白,要么全紅。如果他們?nèi)∏虻淖龇ǔ掷m(xù)的時間足夠長,杰克拿到同顏色大理石的次數(shù)會是吉爾的8倍(兩人的預(yù)期概率分別為12.5%和1.56%)。這個結(jié)果與錘子無關(guān),也與因果聯(lián)系無關(guān),這僅僅是一個數(shù)學(xué)上的事實:一次拿4個彈球與一次拿7個相比,出現(xiàn)極端結(jié)果的概率更大。
?
現(xiàn)在,將美國人口想象成一個巨大的甕中的彈球。有些球上標(biāo)有KC(即腎癌Kidney Cancer的簡稱)字樣,表示腎癌。你抽取彈球樣本,并依次按照所在縣擺放,你會發(fā)現(xiàn)鄉(xiāng)村地區(qū)的樣本要比其他地區(qū)的少。如同杰克和吉爾所做的那個游戲一樣,極端的結(jié)果(非常高或非常低的癌癥發(fā)病率)容易出現(xiàn)在人口稀少的縣,這個故事告訴我們的就是這些。
?
我們從一個令人費解的事實說起:腎癌的發(fā)病率在各縣有所不同,且是有規(guī)律的,我用統(tǒng)計學(xué)理論對此作了解釋:相比于大樣本,極端的結(jié)果(高發(fā)病率和低發(fā)病率)更容易出現(xiàn)在小樣本中。這樣的解釋不存在因果聯(lián)系。某縣的人口稀少既不會引發(fā)癌癥,也不能避免癌癥,只會使癌癥的發(fā)病率比人口稠密地方的發(fā)病率更高(或更低)。這就是真相,沒什么可解釋的。在某個人口稀少的縣,癌癥發(fā)病率并非真的比正常情況更低或更高,只是這個縣正好在某個特殊的年份趕上了抽樣調(diào)查罷了。如果我們在第二年重復(fù)這樣的分析,也能預(yù)測到在小樣本中出現(xiàn)極端結(jié)果的一般模式,但在前一年癌癥發(fā)病率高的縣,這一年發(fā)病率并不一定高。如果是這樣的話,則人口稠密或稀少的因素就無法對發(fā)病率作出解釋了:這些表面因素就是科學(xué)家眼中所謂的假象,即觀察結(jié)果完全依賴于調(diào)查方法的某一方面,在這個案例中,則依賴于樣本大小。
?
我剛才說的例子也許會令你驚訝,但這并不是真相初次大白于天下。你早就知道應(yīng)該更相信大樣本,并且即使是對統(tǒng)計學(xué)一無所知的人也聽說過大數(shù)法則。但是“知道”并非是非抉擇問題,你可能會發(fā)現(xiàn)下列陳述放在自己身上很合適:
·當(dāng)你閱讀這個關(guān)于流行病學(xué)的例子時,并沒有立刻注意到“人口稀少”這一特點與此次調(diào)查有何關(guān)聯(lián)。
·對于采用4個樣本還是7個樣本所產(chǎn)生的不同結(jié)果,你至少會感到有一點驚訝。
·即使是現(xiàn)在,想要確定下面兩個陳述句所說的完全是一回事,你也要費些腦力:
(1)大樣本比小樣本更精確。
(2)小樣本比大樣本產(chǎn)生極端結(jié)果的概率大。
?
第一個表述清晰地陳述了一個事實,但直到感受到第二個表述傳達給你的意思,你才意識到自己并沒有真正理解第一個表述的意思。
?
上述內(nèi)容概括起來就是:沒錯,你知道大樣本的結(jié)果更精確,但你現(xiàn)在可能才意識到你并不清楚為什么它們更精確。不僅你一人如此,阿莫斯與我在一起進行的第一個研究表明,即使是經(jīng)驗豐富的研究人員對樣本效應(yīng)也缺乏直覺,要么就是理解不到位。
?
小數(shù)定律?The Law of Small Numbers
?
沒有接受過統(tǒng)計學(xué)方面訓(xùn)練的人是出色的“直覺性統(tǒng)計學(xué)家”。我與阿莫斯在20世紀(jì)70年代早期的合作便始于對這個觀點的討論。他對我(在大學(xué))的研究班及我本人講過,密歇根大學(xué)的一些研究人員對直覺性統(tǒng)計抱有樂觀態(tài)度。我個人對那個觀點有種強烈的感覺:那段時間我發(fā)現(xiàn)自己并不是一個出色的直覺性統(tǒng)計學(xué)家,但是我也不相信別人會比我好多少。
?
對于一個研究型心理學(xué)家來說,樣本變差沒有什么特別的。它是個煩人且損失又大的麻煩事,會把每項實驗都變成一場賭博。試想你希望證明6歲女孩的平均詞匯量比同齡男孩的詞匯量更豐富的假設(shè)。這個假設(shè)從整體來說是成立的,女孩的平均詞匯量確實要比男孩的豐富一些。然而,盡管男孩與女孩差別很大,但你很可能會抽取到男女相差不太明顯的樣本,甚至?xí)榈揭粋€男孩比女孩詞匯測試成績還要好的樣本。如果你是那個研究者,這個結(jié)果對于你來說代價就太高了,因為它浪費了你的時間和精力,卻無法證實一個實際正確的假設(shè)。使用一個足夠大的樣本是降低這種風(fēng)險的唯一方法。選擇小樣本的研究者只能看自己是不是能選對合適的樣本了。
?
想要對樣本錯誤的風(fēng)險作出評估,只需通過一個相當(dāng)簡單的步驟就可以實現(xiàn)。然而按照慣例來看,心理學(xué)家并不是通過計算來選定樣本大小的。他們聽從自己的判斷,但這些判斷往往是錯的。在與阿莫斯發(fā)生意見分歧不久之前,我讀過一篇文章,文章通過生動的觀察結(jié)果展示了研究人員所犯的錯誤(他們現(xiàn)在仍在犯這種錯誤)。該文作者指出心理學(xué)家選擇的樣本通常都很小,致使他們有50%的風(fēng)險不能夠證實其正確的假設(shè),而任何研究人員都不會在頭腦清醒的情況下接受這種風(fēng)險。對此有一個貌似正確的解釋,即心理學(xué)家對于樣本大小的決定反映了他們普遍存在的一個直覺性錯誤觀念,即對于樣本變差范圍的錯誤看法。
?
這篇文章令我十分震驚,因為我在自己的研究中碰到了一些問題,卻在這篇文章中找到了相關(guān)解釋。與大多數(shù)研究型心理學(xué)家一樣,我也墨守成規(guī)地選擇了一些過小的樣本,因此得到的實驗結(jié)果毫無意義?,F(xiàn)在,我知道了原因:那些奇怪的結(jié)果實際上就是我這種研究方法的典型產(chǎn)物。我的錯誤特別令人尷尬,因為我教過統(tǒng)計學(xué),也知道該怎樣計算樣本的大小,以便將風(fēng)險降至可以接受的程度。但是,我從未通過計算來確定樣本大小。和我的同事一樣,我被傳統(tǒng)所禁錮,相信自己設(shè)計實驗的直覺,也從未認真考慮過樣本選擇會帶來的那些風(fēng)險。阿莫斯來參加研討會時,我已經(jīng)意識到自己的直覺是錯誤的。在研討會中,我們很快達成共識—密歇根的那些樂觀派是錯誤的。
?
我與阿莫斯開始調(diào)查一個問題:只有我自己這么愚蠢還是我只是眾多愚蠢的人之一,我們通過一項測試來證實這個問題,測試對象為一些數(shù)學(xué)家,想看看這些人是否也會犯類似的錯誤。我們設(shè)計了一份調(diào)查問卷,其中描述了真實的研究情境,包括一些成功實驗的復(fù)制。問卷要求研究人員選擇樣品大小,對其決定可能帶來的失敗風(fēng)險進行評估,并為那些正在設(shè)計自己實驗的研究生提供建議。在“數(shù)學(xué)心理學(xué)協(xié)會”的一次會議上,阿莫斯收集了一組資深受試者(包括兩本經(jīng)濟學(xué)著作的作者)的反應(yīng)。結(jié)果很明顯:我并不是唯一一個愚蠢的人。大多數(shù)受試者都會犯和我一樣的錯誤。顯然,即使是專家,在選擇樣品大小時也無法充分集中注意力。
?
我和阿莫斯將我們合寫的第一篇文章命名為“對小數(shù)定律的盲信”。我們半開玩笑地解釋道,“對于隨意取樣的直覺似乎符合小數(shù)定律,由此可以斷言大數(shù)法則對于小數(shù)定律同樣適用”。在文章中,我們還收錄了一個措辭有力的建議,即研究人員認為他們“對于統(tǒng)計直覺應(yīng)抱有一些懷疑,只要條件允許,都應(yīng)采用計算方法來確定樣本規(guī)模,而不是依靠直覺印象作決定”。
?
信任多于質(zhì)疑的普遍性偏見
?
在一次面向300名老年人的電話民意調(diào)查中,有60%的人支持總統(tǒng)。
?
如果你只能用三個詞來總結(jié)這句話,該怎么說呢?幾乎可以肯定的是,你會說“老年人/支持/總統(tǒng)”。這些詞概括了這句話的要點。這次民意調(diào)查被省略掉的細節(jié)—媒介為電話,樣本為300人—本身意義不大,它們提供的背景信息并不怎么引人注意。即使樣本數(shù)量變了,你的結(jié)論也不會發(fā)生變化。當(dāng)然,一個完全荒謬的數(shù)字倒可能會引起你的注意。(例如一項對6名或6億名老年選民的電話民意調(diào)查……)除非你是專業(yè)人員,否則不管樣本是150還是3000,你都不會有什么不同的反應(yīng)。這就是“人們對樣本大小沒有足夠的敏感性”這一表述的意義。
?
這項民意調(diào)查包含了兩方面的信息:新聞本身和新聞的來源。當(dāng)然,你關(guān)注更多的是新聞本身,而不是其結(jié)果的可信度。但當(dāng)可信度明顯很低時,新聞所包含的信息也就不足為信了。如果得知“某黨派小組操縱一項錯誤且?guī)в衅姷拿褚庹{(diào)查,使結(jié)果顯示老年人支持總統(tǒng)……”你當(dāng)然會排斥這項調(diào)查的結(jié)果,不會相信這條新聞,這項由某黨派進行的民意調(diào)查以及其錯誤結(jié)果不但沒有令你信服,反而會成為另一條關(guān)于政治騙局的新聞。在這樣清晰的案例中,你可以選擇不相信其中的信息。但是你能把“我在《紐約時報》讀到……”和“我在辦公室閑聊中聽到……”這兩種說法完全區(qū)分開來嗎?你的系統(tǒng)1能夠區(qū)分出信息的可信度嗎?眼見即為事實的原則表明:不能。
?
如前所述,系統(tǒng)1并不善于質(zhì)疑。它抑制了不明確的信息,不由自主地將信息處理得盡可能連貫。除非該信息被立刻否定,不然,它引發(fā)的聯(lián)想就會擴散開,仿佛這條信息就是千真萬確的。系統(tǒng)2能夠提出質(zhì)疑,因為它可以同時包含不相容的多種可能性。然而,保持這種質(zhì)疑會比不知不覺相信其真實性更加困難。小數(shù)定律是普遍性偏見的一種表現(xiàn),即對事物的信任多于質(zhì)疑。類似這樣的偏見在下面的章節(jié)中還會出現(xiàn)。
?
相信小樣本能反映調(diào)查對象的整體情況,這一強烈偏見也是一個較大問題的一部分。這個問題就是,我們??浯笏娛挛锏南嗳菪院瓦B貫性。許多研究人員過于相信通過有限的幾次觀察得出的結(jié)果,這一現(xiàn)象與光環(huán)效應(yīng)緊密相連。我們常常會覺得自己對某個人很熟悉也很了解,但事實上,我們對他卻知之甚少。系統(tǒng)1在了解事實之前就根據(jù)零散的證據(jù)拼湊了一個飽滿的形象。如果相信小數(shù)定律,急于下結(jié)論的機制就會運作起來。通常情況下,它會建構(gòu)一個言之成理的說法使你相信自己的直覺判斷。
?
對隨機事件作出因果解釋必然是錯的
?
聯(lián)想機制會搜尋原因。在統(tǒng)計規(guī)則方面,我們面對的困難是這些規(guī)則要求使用不同的方法處理問題。依據(jù)統(tǒng)計學(xué)觀點,我們不應(yīng)關(guān)注當(dāng)前事件的成因,而應(yīng)當(dāng)關(guān)注其未來走向。這件事的發(fā)生并沒有什么特殊原因,一切只是機緣而已。
?
因為偏好進行因果思考,我們在估測真實的隨機事件的隨機性時就會犯嚴(yán)重的錯誤。以在某家醫(yī)院依次出生的4個嬰兒的性別為例,男女出生次序明顯是隨機的。每個嬰兒的出生是各自獨立的。在前幾個小時內(nèi)出生的男嬰女嬰數(shù)量并不會影響到下一個出生嬰兒的性別?,F(xiàn)在,請考慮一下可能的序列:
男男男女女女
男男男男男男
男女男男女男
?
出現(xiàn)這些序列的可能性是一樣的嗎?人們的第一反應(yīng)都是“肯定不一樣啊”。但是,這樣的反應(yīng)是錯誤的。因為每個嬰兒的出生都是獨立的事,并且生男生女的概率也幾乎相等,6個嬰兒任何一種可能的性別順序都與別的順序概率相等。即使是現(xiàn)在,你仍然認為這個結(jié)論是正確的,但它實際上是反直覺的,因為只有第三種順序是隨機的。如我們所料,“男女男男女男”比其他兩種順序更有可能發(fā)生。我們追求模式,相信所處的是一個各方面都相互聯(lián)系的世界。在這個世界里,規(guī)律(例如6個女嬰的順序)并不只是偶然發(fā)生的,它還是機械的因果聯(lián)系或是人的意志的結(jié)果。我們并不期待在一個隨機的過程中找到規(guī)律。但當(dāng)探尋到一個可能的規(guī)則時,我們就會拋開這個過程是真正隨機的想法。隨機過程會產(chǎn)生許多序列,以使人們相信這個過程完全是不隨機的。如此你就可以看出來為什么假設(shè)的因果關(guān)系有進步發(fā)展的優(yōu)勢。它是我們從先輩那里繼承的一般警覺性的一部分。我們會習(xí)慣性地搜尋環(huán)境變化的可能性。獅子可能隨時都會出現(xiàn)在平原上,但注意到獅子出現(xiàn)頻率的明顯增長并采取行動則會安全許多,即使這種增長只是由于隨機過程的波動而發(fā)生的。
?
對于隨機性的廣泛誤解有時會帶來重大影響。在我和阿莫斯合作的一篇代表性文章中,我們引用了統(tǒng)計學(xué)家威廉·費勒(William Feller)的闡述,他說,人們很容易在根本沒有模式的情況下創(chuàng)建模式。“二戰(zhàn)”期間,火箭彈在倫敦密集地轟炸。人們普遍相信爆炸不可能是隨機的,因為地圖顯示,爆炸點在各地的分布有明顯區(qū)別。一些人猜測沒有被炸的地點住有德國的間諜。一份嚴(yán)謹?shù)慕y(tǒng)計分析顯示,爆炸點的分布是隨機程序的一個典型代表,同樣也是令人產(chǎn)生它并不是隨機的這一強烈印象的典型代表。費勒評論道:“在沒受過專業(yè)訓(xùn)練的人看來,這一連串轟炸行動就好像具有某種規(guī)律或趨勢了。”
?
很快,我得到一次機會可以把我從費勒那兒學(xué)到的知識派上用場。1973年爆發(fā)的贖罪日戰(zhàn)爭中,我作出的唯一一項重大貢獻就是建議以色列空軍的高級官員停止一項調(diào)查。一開始,由于埃及地對空導(dǎo)彈表現(xiàn)出色,空戰(zhàn)對于以色列來說很不利。以色列方面人員傷亡慘重,其人員分布也不均衡。有人告訴我說,有兩支來自同一基地的空軍中隊,其中一支被擊落了兩架飛機,而另一支一架也沒有被擊落。為了弄明白那支不幸的空軍中隊到底做錯了什么,相關(guān)人員對此展開了調(diào)查。我們沒有理由認為其中一支空軍中隊比另一支更有效率,也并未發(fā)現(xiàn)他們在操作上有何不同。當(dāng)然,飛行員的生活在很多方面會有所不同,據(jù)我回憶,其差異包括他們在任務(wù)之間回家的次數(shù)以及報告任務(wù)的執(zhí)行情況等。我當(dāng)時給出的建議是,司令部應(yīng)該明白之所以出現(xiàn)不同結(jié)果僅僅只是因為他們運氣不同而已,應(yīng)該停止對飛行員的調(diào)查。我推斷這次事件很可能是由于運氣不佳,對不明顯的原因進行隨機調(diào)查必定是勞而無功的。與此同時,空軍中隊不斷有人員損失,沒有必要再給他們增加額外的負擔(dān),讓他們覺得那些去世的伙伴做錯了什么。
?
幾年以后,阿莫斯和他的同學(xué)湯姆·季洛維奇(Tom Gilovich)、羅伯特·瓦?。≧obert Vallone)對籃球隨機性的錯誤直覺所作的研究引起了轟動。運動員有時投籃順手的“事實”普遍被運動員、教練和球迷們所接受。這樣的推斷是順理成章的:如果一個運動員連續(xù)進了三四個球,你就會不由自主作出判斷:這個運動員正處于“投籃順手”的狀態(tài),得分率暫時增加。兩隊隊員都持這種判斷—隊員也更愛將球傳給打得順手的人,對方球隊則會用兩位防守球員防衛(wèi)這位進攻球員。然而,對上千個投籃動作的分析結(jié)果卻十分令人失望:在職業(yè)籃球比賽中,無論球是從球場上投出還是從罰球線投出的,根本沒有“投籃順手”這回事。當(dāng)然,一些球員會比其他球員投籃更準(zhǔn),但進球與投籃未中都只是隨機的?!巴痘@順手”完全只是旁人所見,而且他們太快作出評判了,以至于感知不到隨機事件中的順序和因果關(guān)系?!巴痘@順手”是一個影響深遠的認知錯覺。
?
公眾對于這項研究的反應(yīng)也是這項研究的一部分。這個發(fā)現(xiàn)令人驚訝,很快就受到了媒體關(guān)注,而大家普遍的反應(yīng)都是不相信。當(dāng)著名的波士頓凱爾特人隊教練瑞德·奧爾巴赫(Red Auerbach)聽說了季洛維奇及其發(fā)現(xiàn)(研究)時,他回應(yīng)道:“這人是誰呀?他做了個實驗是吧?不過我對他的觀點不敢茍同?!痹陔S機性中發(fā)現(xiàn)規(guī)律的想法往往不可逆轉(zhuǎn),肯定比某個人作了一項研究更有說服力。
?
對規(guī)律的錯覺在方方面面影響著籃球賽場。你要用多少年的觀察才能肯定一個投資顧問是有真才實學(xué)的?一個執(zhí)行總裁實現(xiàn)多少次成功的兼并,董事會才能確定他對這項工作有著非凡的才能?簡單說來,如果你聽從自己的直覺,就常常會因為把隨機事件看做是有規(guī)律的事件而犯錯。我們都非常愿意相信生活中大多數(shù)事情并不是隨機的。
?
在本章開頭,我引用了一個美國癌癥發(fā)病率的例子。這個例子本來是有意寫給統(tǒng)計學(xué)老師看的,我是從前文中提到的兩位統(tǒng)計學(xué)家霍華德·維納和哈里斯·澤維林所寫的一篇有趣的文章中看到這個例子的。他們寫這篇文章得到了蓋茨基金會17億美元的贊助,用以調(diào)查那些最成功的院校有哪些特點。許多研究人員在那些名聲顯赫的院校中作調(diào)查,希望發(fā)現(xiàn)這些學(xué)校的與眾不同之處,從而尋求成功教學(xué)的秘密。這項研究的結(jié)論之一是,這些著名院校規(guī)模普遍較小。例如在賓夕法尼亞州對1 662所院校的調(diào)查中,排名前50的院校里有6所規(guī)模都較小,是(普通院校)的3倍多。這個數(shù)據(jù)使得蓋茨基金會積極投入大量資金建立小規(guī)模的院校,有時會采取將大的院校拆分成小的院校的方法。另外,其他著名的機構(gòu)中至少有一半也采取了同樣的做法,例如愛林伯格基金會和皮尤慈善機構(gòu)也采取了同樣的做法,美國教育部還啟動了“小型學(xué)習(xí)社區(qū)計劃”。
?
你可能會覺得上述做法很有道理。我們很容易從因果關(guān)系角度去解釋小規(guī)模的院校為什么可以提供優(yōu)質(zhì)的教學(xué)。我們認為,比起大規(guī)模院校,小規(guī)模院校可以給予學(xué)生更多的關(guān)注及鼓勵,因此能培養(yǎng)出成就卓越的學(xué)者。但不幸的是,這樣的因果分析是無意義的,因為得到的結(jié)論都是錯誤的。如果那些向蓋茨基金會提交報告的統(tǒng)計學(xué)家們調(diào)查過最差學(xué)校的特點,他們會發(fā)現(xiàn)那些較差的學(xué)校也比水平一般的學(xué)校的規(guī)模小一些。事實上,規(guī)模小的學(xué)校辦學(xué)水平并不一定更高,他們只不過更懂得變通而已。維納和澤維林說,如果真有什么區(qū)別的話,那就是大規(guī)模院??梢蕴峁┒喾N多樣的課程,所以容易收到好的效果,特別是學(xué)生能拿到高分。
?
多虧了幾年來認知心理學(xué)的發(fā)展,我們現(xiàn)在才能清楚地知道阿莫斯和我所瞥見的不過是冰山一角:小數(shù)定律包含在大腦工作的兩個重要部分中。
?
·夸大對小樣本的信任只是眾多錯覺中的一種—比起信息的可靠度,我們會更加注重信息本身的內(nèi)容,其結(jié)果就是我們會將周圍的世界變得比數(shù)據(jù)所能證明的更加簡單和統(tǒng)一。在想象的世界中過早下結(jié)論比在現(xiàn)實中更有把握。
·統(tǒng)計學(xué)家的很多觀察研究都可歸結(jié)到因果關(guān)系的解釋上,但他們卻不承認是這樣的。許多事實其實只是巧合,包括事件的采樣。對偶發(fā)事件作出因果關(guān)系的解釋必然是錯誤的。
?
示例:小數(shù)定律
“沒錯,自從這個新執(zhí)行總裁接手后,電影制片廠已經(jīng)制作了3部優(yōu)秀電影。不過,現(xiàn)在說他老練還為時過早?!?/span>
“統(tǒng)計學(xué)家能夠估算出這個交易新手表現(xiàn)出來的強勁勢頭是否是偶然的,所以在咨詢統(tǒng)計學(xué)家之前,我不會相信他就是個天才?!?/span>
“觀察的樣本太小,所以不能作出任何推斷。我們不要遵從小數(shù)定律?!?/span>
“在我們有足夠大的樣本之前,我計劃對實驗結(jié)果暫時保密。否則,我們會有過早下結(jié)論的風(fēng)險?!?/span>
第十章 完