最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

《思考,快與慢》中文 第二十一章:直覺判斷與公式運算,孰優(yōu)孰劣?

2021-04-27 14:23 作者:追尋花火の久妹Riku  | 我要投稿

《思考,快與慢》Thinking, Fast and Slow 原文 書籍翻譯 第二十一章

作者:[美]丹尼爾·卡尼曼

【以下內(nèi)容為作者的正文】注:根據(jù)語意略有改動,但不影響原意。


第21章 直覺判斷與公式運算,孰優(yōu)孰劣?

?

保羅·米爾(Paul Meehl)是個性格奇特而又超凡脫俗的人,是20世紀最有才華的心理學(xué)家之一。他曾在明尼蘇達大學(xué)的心理學(xué)系、法學(xué)系、精神病學(xué)系、神經(jīng)病學(xué)系以及哲學(xué)系任教,同時寫了宗教、政治科學(xué)方面的文章,還曾經(jīng)研究過老鼠。米爾習(xí)慣用統(tǒng)計數(shù)字說話,經(jīng)驗豐富,曾對臨床心理學(xué)的空洞言論大加批評,在精神分析方面有過實踐。他寫過一些論述心理學(xué)研究的哲學(xué)基礎(chǔ)的文章,這些文章很有思想,我在讀研究生時幾乎能把它們?nèi)勘诚聛?。我從來沒見過米爾,但自從我讀了他的那本《臨床與統(tǒng)計的預(yù)測:理論分析與事實回顧》(Clinical vs. Statistical Prediction:A Theoretical Analysis and a Review of the Evidence)后,他便成了我心目中的一位英雄。

?

在這本他后來稱為“讓我煩惱的小書”的薄冊子里,米爾回顧了20項研究結(jié)果,這些結(jié)果分析了以經(jīng)過訓(xùn)練的專業(yè)人士主觀印象為基礎(chǔ)的“臨床預(yù)測”,是否比按某種規(guī)則將一些分數(shù)或等級評定結(jié)合在一起作出的“統(tǒng)計”預(yù)測更準確。在一項典型的研究中,經(jīng)過訓(xùn)練的輔導(dǎo)員預(yù)測了新生在學(xué)年末的成績。他們與每個學(xué)生進行了45分鐘的談話,還參考了他們高中時的成績、幾次能力測試加上一份4頁長的學(xué)生的個人陳述。數(shù)據(jù)統(tǒng)計的方法則只采用了其中的一小部分信息,即高中成績和能力測試。然而,應(yīng)用數(shù)據(jù)統(tǒng)計方法得出的結(jié)果要比14名輔導(dǎo)員中11個的預(yù)測都準確。米爾綜合其他多種預(yù)測結(jié)果得出了相似的結(jié)論,這些預(yù)測包括違反假釋程序、飛行員的成功訓(xùn)練以及刑事累犯情況等。

?

不出所料,米爾的著作在臨床心理學(xué)家中引起了震驚和質(zhì)疑,這一爭議引發(fā)了一股研究大潮,自該書出版至今50余載,這股大潮還在繼續(xù)。將臨床預(yù)測和統(tǒng)計預(yù)測進行對比的研究報告大約已有200篇,然而兩者的對峙依然沒有分出勝負。大約60%的研究指出,運算手法更準確。其余的比較研究認為兩者準確性相近,但似乎數(shù)據(jù)統(tǒng)計方法更勝一籌,因為它比人工判斷的成本低。至今還沒有令人信服的例外情況記錄在案。

?

預(yù)測結(jié)果的范圍已經(jīng)延伸到了醫(yī)學(xué)的可變因素,比如癌癥病人的壽命、住院時間、心臟病的診斷以及嬰兒對猝死綜合征的敏感性;經(jīng)濟措施,比如新企業(yè)的成功前景、銀行對信用危機的評估、員工對未來職業(yè)的滿意度;政府機構(gòu)所關(guān)心的問題,比如收養(yǎng)人的適合條件評估、少年累犯的可能性以及其他暴力行為發(fā)生的可能性;還有一些混合結(jié)果評估,比如科學(xué)報告的評估、橄欖球比賽的勝負預(yù)測以及波爾多酒的價格預(yù)測。這些領(lǐng)域都有很強的不確定性和不可預(yù)見性。我們將其稱為“有效性低的環(huán)境”。在這些情況下,專家預(yù)測的準確性與簡單的運算得到的結(jié)果相當,甚至還要低于簡單運算的結(jié)果。

?

在該書出版30年后,米爾自信而驕傲地說:“在社會科學(xué)中,還沒有哪一項研究像這項一樣,眾多研究雖定性不同,結(jié)果卻都一致地指向同一個方向,這一點是毫無爭議的?!?/span>

?

專家預(yù)測比不上簡單運算準確

?

奧利·阿申菲爾特(Orley Ashenfelter)是普林斯頓大學(xué)的經(jīng)濟學(xué)家,愛喝葡萄酒。對于簡單的統(tǒng)計學(xué)方法的力量可以勝過世界著名學(xué)者的觀點,阿申菲爾特曾經(jīng)作過一個引人注目的論證。他想通過波爾多酒生產(chǎn)年所提供的相關(guān)信息來預(yù)測該酒的未來價值。這個問題之所以重要,是因為優(yōu)質(zhì)葡萄酒要想達到質(zhì)量的頂峰需要很多年。出自同一個酒窖的酒,因其年份不同,在價格上有很大差異。生產(chǎn)時間相差12個月的酒,其價值會相差10倍或更多。預(yù)測未來價格的一項因素是它的本質(zhì)價值,因為投資者買酒就像買藝術(shù)品一樣,都希望它能夠增值。

?

人們通常認為葡萄酒釀造期之所以能夠決定酒的好壞是受生長期間天氣多樣性的影響,溫暖干燥的夏季會釀就最好的葡萄酒,因此全球變暖貌似會惠及葡萄酒產(chǎn)業(yè)。濕潤的春天也會使這一產(chǎn)業(yè)受益,這樣的天氣會在不影響質(zhì)量的情況下增產(chǎn)。阿申菲爾特通過天氣的三個特征—夏季生長期的平均溫度、豐收期的降水量以及上一個冬季的總降水量—來估測出葡萄酒的特質(zhì)及特定的年份,再將這些常識性知識轉(zhuǎn)化成數(shù)據(jù)公式來預(yù)測葡萄酒的價格。他的公式給出了未來幾年甚至幾十年后的準確價格預(yù)測。事實上,他的公式所預(yù)測的葡萄酒期貨價格比新酒的市價更準確。這個新的“米爾模式”向那些為前期價格定位提供建議的專家的估價能力發(fā)起了挑戰(zhàn)。它還對經(jīng)濟理論發(fā)起了挑戰(zhàn),根據(jù)這些理論,價格應(yīng)該能夠反映出所有有用信息,包括天氣因素。阿申菲爾特的公式非常精確,預(yù)測價格與真實價格的相關(guān)系數(shù)超過了0.9。

?

為什么專家預(yù)測不如簡單運算準確?米爾猜測其中一個原因是這些專家試圖變得聰明,總想跳出思維的框框,在預(yù)測時會考慮將不同特征進行復(fù)雜的結(jié)合。復(fù)雜化對稀奇古怪的事情是有影響的,但十有八九會降低其正確性,將這些特征簡單地整合在一起反而會更好。有幾項研究已經(jīng)表明,即使人們知道公式給出的建議分數(shù),人類決策制定者在面對預(yù)測公式時也會自嘆弗如。他們認為自己比公式強大,因為人們擁有關(guān)于這一問題的其他信息,但他們往往是錯的。在米爾看來,在極少數(shù)情況下,我們可以利用主觀判斷,其他時候用判斷替代公式并不是個好主意。在一個著名的思維實驗中,他描述了一個能夠預(yù)測某人今晚會不會去看電影的公式,他指出,如果知道此人今天摔斷了腿,不用這個公式也罷。于是就有了“斷腿原則”。當然,關(guān)鍵問題是斷腿的概率太小了,但一旦腿斷了,結(jié)論也就很明確了。

?

專家判斷不可取的另一個原因,是人們對復(fù)雜信息的最終判斷很難達成一致。如果有人要求這些專家對同一信息進行兩次評估,他們通常會給出不同的答案。這些不一致之處往往正是真正令人關(guān)切的地方。一個經(jīng)驗豐富的放射科醫(yī)師在兩個不同的場合看到同一張片子,這兩次檢查結(jié)果在“正常”與“異?!敝g會有20%的偏差。一項讓101名審計員獨立評價企業(yè)內(nèi)部審計業(yè)務(wù)可靠性的實驗也反映出類似的不一致程度。此前曾有過對不同專業(yè)人士判斷可靠性的41項研究,研究要求審計員、病理學(xué)家、心理學(xué)家、組織管理者等專業(yè)人士回顧自己原來的判斷。盡管他們對每個案例的再次評估在幾分鐘內(nèi)就完成了,但實驗結(jié)果還是說明了判斷的不一致性非常典型。不可靠的判斷使人們對任何事物都不可能作出有效預(yù)測。

?

這種普遍的不一致性很有可能是由于系統(tǒng)1對極端條件的依賴所致。我們從那個主要實驗可以得知,在我們的環(huán)境中有一種不被注意的刺激物在本質(zhì)上影響著我們的思想和行為。這種影響會從這一時刻波及下一時刻。在炎熱的天氣里,短暫的涼風會使你感到心情舒暢,這個時刻無論評估什么都會相對更積極一些。對于一個將要獲得假釋的犯人來說,在假釋審核期間的每一頓飯之間,他都會有很大的變化。由于我們對我們思想中的東西沒有一個清晰的認識,我們永遠不會知道在周圍環(huán)境有微小的變化時,我們會作出不一樣的判斷。公式卻不會有這樣的問題,輸入不變,輸出也不會改變??深A(yù)見性很差—這是米爾和他的后繼者們在研究中得出的—不一致性會破壞任何預(yù)測的有效性。

?

這項研究得出了一個驚人的結(jié)論:要提升預(yù)測的準確度,最終的結(jié)果應(yīng)由公式給出,在低效的情況下尤其如此。例如,在醫(yī)學(xué)院的學(xué)生錄取工作中,最終決定一般由面試候選人的老師來做。這一依據(jù)是片面的,但他們的推測也有可靠的證據(jù):如果面試官也參與最終的錄取工作,面試的過程很可能會降低選拔過程的準確性。這是因為面試官過于相信自己的直覺,他們會很重視個人的喜好而忽略很多其他信息,從而降低了有效性。同樣,專家在評估新酒的價格時會品嘗酒,這種信息的反面作用大于正面。當然,即使清楚天氣對酒質(zhì)的影響,專家們也無法保證公式那樣的一致性。

?

繼米爾的最初研究之后,促進該領(lǐng)域最重要發(fā)展的要數(shù)羅賓·道斯所發(fā)表的著名論文《決定中非正當線性模型的穩(wěn)定之美》了。社會科學(xué)中常用的數(shù)據(jù)統(tǒng)計分析是按照某一運算法則評估不同的預(yù)測因素,這叫做多次回歸,且已經(jīng)被運用于常用軟件中。多次回歸中體現(xiàn)的邏輯很有說服力:它找到了將各種預(yù)測因素權(quán)衡后再整合到一起的最理想公式。然而,道斯發(fā)現(xiàn),這種復(fù)雜的數(shù)據(jù)運算沒什么用處,人們也可以通過選取一組對于預(yù)測結(jié)果以及提升價值都很有效的數(shù)據(jù)作出類似的判斷(使用標準數(shù)據(jù)或者是等級)。一個公式與這些預(yù)測因素以同樣的權(quán)重結(jié)合起來預(yù)測新事物才有可能像使用多次回歸處理原始樣本一樣取得理想的預(yù)測效果。更新研究則更深入地指出:均衡考慮各項預(yù)測因素的公式更有優(yōu)勢,因為它們不受樣本突變的影響。

?

這種基于等權(quán)原則的計算方案的成功有著重要的實踐意義:它可以在不作任何事前統(tǒng)計研究的基礎(chǔ)上就能開發(fā)出有用的運算方法。這種基于現(xiàn)有數(shù)據(jù)或者常識的簡單等權(quán)公式通常可以預(yù)測出意義重大的結(jié)果。在一個令人難忘的例子中,道斯指出了婚姻的穩(wěn)定性可以通過一個公式來預(yù)測:

?

性生活的頻率?減去?爭吵的頻率

你應(yīng)該不會希望得到的結(jié)果是負數(shù)。

?

這個研究的重要結(jié)論是,在信封背面構(gòu)思的一個運算公式通??梢院屠硐牖墓芥敲?,與專家的言論相比肯定更勝一籌了。這種邏輯適用于很多領(lǐng)域,從證券投資組合經(jīng)理對股票的選擇,到醫(yī)生和病人對治療方式的選擇。

?

一項拯救了千萬嬰兒的簡單運算法堪稱對于這項研究的經(jīng)典應(yīng)用。婦產(chǎn)科醫(yī)生清楚地知道,如果嬰兒在出生后的幾分鐘內(nèi)無法正常呼吸的話,他/她就會有很大的腦損傷甚至夭折的風險。在1953年麻醉學(xué)家弗吉尼亞·阿普加(Virginia Apgar)介入之前,內(nèi)科醫(yī)生和接生人員一直在用他們的臨床經(jīng)驗來判斷嬰兒是否處于危險狀態(tài),不同人員的依據(jù)也不盡相同。一些人側(cè)重于觀察孩子的呼吸情況,另一些人則觀察嬰兒的啼哭頻率。由于沒有一個標準,人們經(jīng)常錯過危險信號,導(dǎo)致許多新生兒不幸夭折。

?

一天早飯后,一個住院醫(yī)生問阿普加醫(yī)生如何對新生兒作系統(tǒng)評估。她回答道:“這很簡單,你可以這樣做?!卑⑵占涌焖賹懴铝?個變量(心率、呼吸、反應(yīng)、肌肉強度和顏色)以及3個分數(shù)(0、1、2分別代表各個變量的穩(wěn)健度)。阿普加意識到自己可能會有所突破,而且這一突破還可能被應(yīng)用到所有的產(chǎn)房中,她便開始用這種方法評估每一個出生一分鐘的嬰兒。一個得到8分以上的嬰兒一般是膚色粉紅、蠕動、啼哭、面部扭曲并擁有100次以上的脈搏,這樣的嬰兒外形很好。低于4分的嬰兒一般是渾身青紫、肌肉松弛、不愛動且心跳微弱,這樣的嬰兒需要立即救治。應(yīng)用了阿普加的評分原則后,產(chǎn)房的護士們終于在判斷嬰兒情況是否危險的問題上有了一套標準,人們認為這個公式對減少嬰兒的夭折率起到了很重要的作用?,F(xiàn)在,阿普加的方法依然應(yīng)用于每一個產(chǎn)房中。阿圖爾·甘德(Atul Gawande)近期的著作《一份清單宣言》(A Checklist Manifesto)也介紹了一些其他案例,以說明列表以及簡單原則的優(yōu)點。

?

讓許多業(yè)內(nèi)人士煩惱的運算法

?

從一開始,很多臨床心理學(xué)家就不認同米爾的觀點,對此持懷疑態(tài)度。他們顯然幻想過自己有長遠預(yù)測的能力。我們在深思熟慮后,不難發(fā)現(xiàn)這種幻想是如何產(chǎn)生的,也可以理解臨床醫(yī)生為何反對米爾的研究。

?

證明臨床統(tǒng)計可信度低的統(tǒng)計證據(jù)與臨床醫(yī)師對自己判斷質(zhì)量的日常體驗相悖。經(jīng)常接觸患者的醫(yī)生對每一個療程都有其直覺,他們可以預(yù)測病人對干預(yù)治療會有什么反應(yīng),并猜測下一步會發(fā)生什么。很多推測都得到了證實,這顯示出臨床醫(yī)師真實的臨床診斷能力。

?

問題是在整個治療期間,這些正確的判斷涉及的都是短期預(yù)測,而且是在當面診療后作出的預(yù)測,這項技能是治療師經(jīng)過長期實踐得來的。他們失敗的任務(wù)往往需要對病人的病情作長遠的預(yù)測。想要做到這一點尤為困難,因為即使是最好的公式也只能是有個大概,臨床醫(yī)師也不可能完全了解,這需要患者多年的反饋,而不僅僅是當時短暫的治療反饋。然而,臨床醫(yī)師可以出色完成的任務(wù)與他們完全不能做的事情之間沒有絕對的界限,當然他們自己也是如此認為。他們知道自己有醫(yī)術(shù),但卻不一定知道醫(yī)術(shù)的終極。當然,認為機械地將幾個變量整合到一起就會超過人工判斷微妙的復(fù)雜性的想法對有經(jīng)驗的臨床醫(yī)師來說顯然也是錯誤的。

?

這場關(guān)于臨床預(yù)測與數(shù)據(jù)統(tǒng)計預(yù)測孰優(yōu)孰劣的辯論總會涉及倫理道德的范疇。米爾寫道,統(tǒng)計方法被那些臨床醫(yī)師批評為“機械化、自動化、附加物、模式化、人工化、不真實、表面化、武斷、不完善、無生機、迂腐、片面、無關(guān)緊要、武斷、數(shù)據(jù)化、表面化、死板、無前景、學(xué)術(shù)化、偽科學(xué)且很盲目”。相反,臨床方法被它的支持者稱贊為“靈活、全球化、有意義、正統(tǒng)、精細、統(tǒng)一、機構(gòu)完整、有規(guī)律可循、系統(tǒng)化、豐富、深邃、真實、科學(xué)、成熟、準確、生動、正確、自然、可行,以及可以被理解”。

?

這種觀點我們都可以理解。無論是約翰·亨利(John Henry)在山頂上揮錘,還是國際象棋天才蓋瑞·卡斯帕羅夫(Garry Kasparov)與計算機“深藍”的對決,我們總會同情我們?nèi)祟愖约?。對通過數(shù)理統(tǒng)計來作決定的厭惡情緒影響著人類,這種厭惡源于我們本身對自然事物的偏好以及對人工合成產(chǎn)物的否定。選蘋果時,如果有人問我們喜歡有機的蘋果還是商業(yè)種植的,大多數(shù)人都會傾向于“全天然”的那個。即使被告知兩者的口味相同、營養(yǎng)相同而且同樣衛(wèi)生,很多人還是會選擇有機水果。商人們甚至發(fā)現(xiàn),標簽上印有“全天然”或者“不添加防腐劑”時,銷量就會增加。

?

歐洲葡萄酒協(xié)會對阿申菲爾特推測波爾多酒價格這一公式的反應(yīng)表明,業(yè)內(nèi)人士對揭秘專業(yè)知識有著強烈的抵觸情緒。阿申菲爾特的公式對公眾而言是一種福祉:我們原本以為各地的葡萄酒愛好者都會感謝阿申菲爾特,他提出的公式提高了這些人辨別葡萄酒質(zhì)量的能力,使他們能夠分辨哪些葡萄酒多年后會有上乘的品質(zhì)。然而事實卻并非如此,據(jù)《紐約時報》報道,法國葡萄酒界對此的表現(xiàn)是在“憤怒和歇斯底里之間”。阿申菲爾特指出一個品酒專家認為他的發(fā)現(xiàn)“荒唐可笑”,還有一個人也嘲笑他“就像沒有親自看過電影卻對這部電影評頭論足”。

?

作重要決定時,對運算法的偏見就會被放大。米爾指出:“有些臨床醫(yī)師會因一個‘盲目的、機械化的’公式而耽誤了可以治療的病例,這是很可怕的,但我也沒有什么好辦法來緩和這種令人恐懼的情形?!毕喾?,米爾和其他的運算法支持者激烈爭論,如果說運算法在作出重大決定的時候可以減少錯誤,那么仍舊憑直覺判斷就是不道德的。他們的論述有理有據(jù),但卻與一個心理學(xué)事實背道而馳:對大多數(shù)人來說,錯誤的原因最重要。由于運算法導(dǎo)致嬰兒死亡的案例比人為因素造成的悲劇更讓人感到悲痛。這種情感強烈程度已經(jīng)上升到道德取向的層面了。

?

值得慶幸的是,隨著運算法在生活中適用范圍的不斷擴大,人們也在慢慢接受它。我們在尋找喜歡的書籍或音樂時,會接受軟件推薦的選項;我們理所當然地認為人為因素并沒有影響信貸限額的決定;我們也越來越習(xí)慣那些以簡單的運算法形式出現(xiàn)的指導(dǎo)方針,比如說我們應(yīng)該努力將有益和有害的膽固醇水平維持在什么比例。公眾現(xiàn)在已經(jīng)意識到,在體育界公式能比人做得更好:一個職業(yè)球隊該給新隊員開多少薪水,或者在第四節(jié)的什么時候該踢凌空球。隨著運算法使用范圍的擴大,大多數(shù)人第一次接觸米爾在他那本“讓我煩惱的小書”中提到的結(jié)果模式時,他們的不適應(yīng)感最終必將會降低。

?

“閉上眼睛”的直覺判斷比主觀判斷更可取

?

1955年,作為以色列國防軍中一個21歲的陸軍中尉,我接受指派為全軍建立一套測試系統(tǒng)。你也許會驚訝為什么會將如此重任交給我這么年輕的人,但請記住,以色列當時建國才7年,國內(nèi)所有的機構(gòu)都在籌建當中,必須有人去建設(shè)。今天聽來有些奇怪,我的心理學(xué)學(xué)士學(xué)位竟然能夠證明我有能力成為軍中最訓(xùn)練有素的心理學(xué)家。我的頂頭上司是一個才華橫溢的研究者,他擁有化學(xué)學(xué)士學(xué)位。

?

當我接到任務(wù)時,例行面試已經(jīng)準備就緒。每一個入伍的士兵都要完成一系列心理素質(zhì)測試,對那些有作戰(zhàn)任務(wù)的士兵要進行個性評估。我們的目標是要給這些新兵對作戰(zhàn)適應(yīng)性打一個分,并在步兵、炮兵、裝甲兵等兵種中給他們選擇一個最適合他們個性的兵種。面試官們本身也是新兵,之所以被選中做面試官是因為她們智商高,喜歡與人打交道,她們中的大多數(shù)人是當時不必參戰(zhàn)的女兵。經(jīng)過幾周培訓(xùn)后,她們學(xué)會如何安排一個15~20分鐘的面試,培訓(xùn)人員還鼓勵她們要覆蓋多個話題,而且要盡量對被測試者日后在軍中的表現(xiàn)情況形成一個整體的印象。

?

不幸的是,接下來的評估已經(jīng)顯示這種測試過程對預(yù)測新兵日后成功與否毫無用處。于是他們要求我設(shè)計一個更有用但不會更耗時的測試。他們還要求我設(shè)計新的面試方法,并評估這個方法的準確性。從專業(yè)角度來講,這些任務(wù)的難度與讓我建一座橫跨亞馬孫河的大橋差不多。

?

幸運的是,我讀過保羅·米爾那本一年前出版發(fā)行的“小書”。我很相信書中的論證,認為簡單的運算法優(yōu)于臨床的直覺判斷。我總結(jié)出,當前的面試之所以失敗,部分原因是它允許面試者按照個人的喜好作決定,這個決定會因面試者的心理活動而發(fā)生一些變動。相反,我們應(yīng)該用限時的項目來獲得受試者在正常環(huán)境下更具體的信息。我從米爾那里還學(xué)到了我們應(yīng)該摒棄這種用面試者的整體評估來給新兵打分的方法。米爾的書中指出這種評估不值得相信,而運算法從分散的評價中得出的結(jié)果則更有價值。

?

我決定采用這樣的過程,面試者要評估幾項相關(guān)個性特征,為每項單獨打分。最后的作戰(zhàn)適應(yīng)性結(jié)果由計算機根據(jù)一個特定的公式給出,面試者不干預(yù)。我列了一個表格,其中包含與作戰(zhàn)表現(xiàn)相關(guān)的6個特點,包括責任心、社交能力以及男子氣概等。之后我再針對每個特點整理出一系列關(guān)于他們?nèi)胛橹吧畹膯栴},例如之前做過幾份工作、工作和學(xué)習(xí)時是否準時、和朋友交往的頻率,以及他的興趣愛好和參加過的運動等。這便使我能盡量客觀地從每個角度對新兵進行評估。

?

通過這些標準化的真實問題,我希望能夠排除光環(huán)效應(yīng),排除人們喜好的第一印象對判斷結(jié)果的影響。為了進一步預(yù)防各種光環(huán)的影響,我要求面試官依照固定的順序去測試這6個特點,在測試下一個特點之前要對前一個特點按5分制打分。我告訴他們不要為新兵在部隊的未來發(fā)展操心。他們唯一的工作就是找出與新兵的過去相關(guān)的信息并以此來給每一個特性打分?!澳銈兊淖饔镁褪翘峁┛煽康臏y定值,”我說,“處理預(yù)測有效性的工作讓我來?!蔽疫@句話的意思是我要用公式來整合他們的具體得分。

?

面試官們齊聲抗議這種安排。這些優(yōu)秀的年輕人對我這個和他們差不多大的中尉的命令有點不情愿,畢竟這樣的要求禁止他們運用直覺,將注意力完全放在一些無聊的真實問題上。其中一個人抱怨說:“你在把我們變成機器人吧!”所以我妥協(xié)了,“按照要求進行測試吧,”我說,“請完全按照要求來進行測試,測試完后,就像許愿那樣閉上眼睛,將新兵想象成一個戰(zhàn)士,并給他打分。

?

我們對幾百次面試都采用了這個新方法。數(shù)月之后,我們收集了新兵指揮中心對他們表現(xiàn)的評價,這使我們很欣喜。正如米爾的書中提到的那樣,新的測試過程比原來的過程有質(zhì)的飛躍。雖然離完美還有一定差距,但6項指標整合起來作出的預(yù)測比之前的整體評估要準確得多。我們已經(jīng)從“徒勞”進步到了“有效”。

?

面試官“閉上眼睛”后的直覺判斷也很準確,甚至和整合6項指標得到的運算結(jié)果一樣準確,這是我最為驚喜的地方。我從這一發(fā)現(xiàn)中學(xué)到了畢生難忘的一課:即使是不那么正規(guī)嚴肅的遴選面試,直覺也會起到積極作用,當然前提是按照規(guī)定收集客觀信息并對不同特性進行獨立評分。我建立了一個給予“閉眼”評估和整合6項指標同等權(quán)重的公式。從這件事中我學(xué)到一個普遍規(guī)律:不要簡單地相信直覺判斷—無論是你自己的還是他人的—但也不要完全拋開它。

?

45年后,我獲得了諾貝爾經(jīng)濟學(xué)獎,在以色列一時間也小有名氣。在一次訪問中,一些人想帶我看看舊時服役的軍事基地,那里依然矗立著測試新兵的房子。有人把我介紹給心理組的司令部官員,她向我介紹了目前的測試方法,和我當時設(shè)計的沒有什么兩樣。在那里,大量研究顯示該測試依然有效。最后在介紹如何引導(dǎo)面試官時,她補充道:“我們告訴他們,‘閉上你們的眼睛’?!?/span>

?

本章的內(nèi)容已經(jīng)在部隊人力測試以外的項目中也得到了應(yīng)用。按照米爾和道斯的原則進行的測試過程相對來說不怎么費力,但卻相當嚴格。設(shè)想你要為你的公司招聘一名銷售人員。如果真的想選擇最合適的人選,那么你應(yīng)該這樣做:首先,選擇一些這個崗位要求的先決條件(比如技能熟練程度、個性穩(wěn)重程度、可靠性等)。不要列太多,6個左右即可。這些條件最好相對獨立,同時要保證你通過一個問題就能夠?qū)@幾個條件進行評估。下一步就是為每個條件都列出一些問題,并想好如何對其進行評估,分數(shù)為1~5分。你應(yīng)該清楚什么情況“最弱”,什么情況“最強”。

?

作這些準備大約需要半個小時,這種很小的投入能保證你招聘到的員工的質(zhì)量。為了避免光環(huán)效應(yīng),你必須在一定時間內(nèi)完成某一個特性的信息采集并對其打分,之后才能測試下一個。不要越過某個特性去測其他項目。評估每個候選者時,要將這6項評分累加起來。由于你要負責作出最終決定,那就不要“閉眼”測試了。即使你認為其他候選人更合適,也一定要雇用那個得分最高的人—請盡量克制自己創(chuàng)造“斷腿”機會改變排位的想法。大量的研究可以向你保證:只要按照該過程操作,你就能找到最合適的人選。這比人們通常用的那些沒有準備就開始面試,并依靠“我看到了他深邃的眼神,我喜歡自己看到的一切“這類主觀判斷要好得多。

?

示例人工判斷和公式運算

“不管何時,只要公式能替代人工判斷,我們至少應(yīng)該考慮一下(運算法)。”

“他認為自己的判斷既縝密又微妙,但實際上把一些分數(shù)簡單地整合在一起也許會更勝一籌?!?/span>

“我們應(yīng)該事先考慮清楚自己有多重視這些候選者以往的表現(xiàn),否則,對他們的第一印象會對我們產(chǎn)生過多的影響?!?/span>


第二十一章 完

《思考,快與慢》中文 第二十一章:直覺判斷與公式運算,孰優(yōu)孰劣?的評論 (共 條)

分享到微博請遵守國家法律
和顺县| 绥棱县| 湘阴县| 昌乐县| 西林县| 纳雍县| 全椒县| 会东县| 铜川市| 云梦县| 呈贡县| 康定县| 安阳县| 浑源县| 高雄县| 财经| 岳阳县| 伊通| 年辖:市辖区| 陆良县| 桂林市| 南昌市| 兴国县| 郸城县| 尤溪县| 洪泽县| 嘉定区| 桦南县| 安图县| 乐清市| 大丰市| 建昌县| 仁布县| 濉溪县| 乾安县| 博客| 怀集县| 陈巴尔虎旗| 绥滨县| 彩票| 滨州市|