最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

噪聲標注

2021-10-02 22:40 作者:阿強憨憨  | 我要投稿

統(tǒng)計思維。關(guān)于炒股,關(guān)于人工智能好像能獲得一些靈感。

標注

?

關(guān)于判斷中不必要的變異性,一個常見的誤區(qū)是認為它無關(guān)緊要,因為通常來說,隨機錯誤是可以相互抵消的。當然,在關(guān)于同一案件的判斷中,正負誤差會趨于相互抵消,我們將詳細討論如何利用這一特性來減少噪聲。但存在噪聲的系統(tǒng)并非對同一案例做出了多次判斷,而是對不同的案例做出了有“噪聲”的判斷。如果保險公司對一份保單的理賠金額估價過高,而對另一份保單估價過低,從平均值而言,兩次 估價看起來可能是適當?shù)?,但實際上保險公司卻犯下了兩次代價高昂的錯誤。如果兩名罪犯都應該被判處5年有期徒刑,卻分別被判處了3年和7年有期徒刑,那么盡管平均值是5年,但事實上正義并沒有得到伸張。因此可以看出,在充滿噪聲的系統(tǒng)中,錯誤不會相互抵消,只會累加。

噪聲就像地下室漏水,它之所以能被容忍,不是因為人們認為它是可接受的,而是因為它一直未被發(fā)現(xiàn)

重復決策中的噪聲可以通過噪聲審查識別出來。單一決策與重復決策是有區(qū)別的。

如果單一決策與重復決策一樣存在噪聲,那么用于減少重復決策中噪聲的策略應該也可以用于提高單一決策的品質(zhì)。

無論只做一次決策還是做一百次決策,你的目標都應該是減少偏差和噪聲,而且減少錯誤的實踐方法在單一決策和重復決策中同樣有效。

能否驗證并不會改變你的判斷經(jīng)驗。在一定程度上,當一個問題的答案很快就被揭曉時,你可能會更加積極地思考,因為害怕出錯,所以你的注意力更加集中。相反,你可能會拒絕對一個荒謬的假設(shè)性問題做太多思考,比如,如果甘巴迪有三條腿、能飛,他會是一個更好的CEO嗎?總體而言,你會用解決現(xiàn)實問題的方式去解決一個假設(shè)性問題。這種相似性對心理學研究很重要,因為很多研究使用的都是這種假設(shè)性問題。



內(nèi)部信號的本質(zhì)特征在于:一致感是判斷經(jīng)驗的一部分。它并不完全取決于真正的結(jié)果。因此,內(nèi)部信號對于不可驗證的判斷與對于真實的、可驗證的判斷一樣可用。這樣就可以解釋,為什么我們對于像甘巴迪這樣的虛假人物做出判斷的經(jīng)驗,就像是在真實世界中做判斷。

測量和減少噪聲應該與測量和減少 偏差同等重要。

偏差是強調(diào)數(shù)據(jù)與標準值的差。

噪聲是強調(diào)數(shù)據(jù)本身的方差。

單次測量的誤差=偏差+噪聲誤差

均方誤差=偏差平方+噪聲平方


水平噪聲:法官們各有特點。有的人是“鐵面判官”,他們比一般法官更嚴厲;有的人是“柔情法官”,他們比一般法官更仁慈。我們將這些差異稱為“水平誤差”( level errors).(再次提醒:這里的誤差是指判決結(jié)果與平均值之間的差異;如果判決結(jié)果的平均值是錯的,一個誤差可能反倒糾正了這種不公正。)

模式噪聲:在有些案件上,他們比自己量刑的平均水平嚴格;但在其他案件上,他們則表現(xiàn)得要寬容。我們將這種殘存的變異稱為“模式誤差”.如果你在表格的每一個單元格中寫下這些模式誤差,就會發(fā)現(xiàn):對于每一位法官(行)而言,這些模式誤差之和為0;對每一起案件(列)而言,它們的和也是0。但模式誤差對噪聲的影響不能相互抵消,因為在計算噪聲時,使用的是每個單元格中數(shù)值的平方。

總結(jié)

水平噪聲是指不同法官做出的判決與平均值之間的變異。

模式噪聲是指法官對特定案件做出的反應的變異。

模式噪聲偏差一般比水平噪聲大,是其4倍。

在本研究中,水平噪聲和模式噪聲的數(shù)量幾乎相等。然而,模式噪聲中肯定會包含一些情境噪聲,后者可以被看作隨機誤差。

系統(tǒng)噪聲平方=水平噪聲平方+模式噪聲平方

出現(xiàn)這種情況的原因是一個基本的統(tǒng)計事實:對多個獨立判斷或測量進行平均會產(chǎn)生一個新的判斷,雖然這一判斷不一定會比個體判斷產(chǎn)生更少的偏差,但它會產(chǎn)生更少的噪聲。


如果你能從別人那里得到獨立的意見,那么就去做吧,因為這種真正的群體智慧很可能會提升你的判斷水平;如果不能,你可以再次做出判斷,以此創(chuàng)造一個“內(nèi)部群體”。針對后者,你可以采用兩種方式:要么隔一段時間再做出第二次判斷,要么質(zhì)疑自己的第一次判斷,從另一個角度來看待問題。此外,不管是哪一種類型的“群體”,除非你有充足的證據(jù)表明需要對其中一次評估賦予更高的權(quán)重,否則對兩次判斷進行平均后的判斷就是最佳判斷。


你的第一個答案并不是根據(jù)你的全部知識甚至那些關(guān)鍵的知識得出的,你給出的答案只是你頭腦中可能產(chǎn)生的一系列答案中的一個。我們從同一個人對同一個問題的判斷中觀察到的變異性,并不是一些高度專業(yè)的問題中存在的偶然現(xiàn)象,事實上,情境噪聲無時無刻不在影響著我們的判斷。

群體噪聲:微小的差別可能導致一個群體鑒定地說是,而本質(zhì)上相同的另一個群體卻堅定的說否。

小群體易受微小差別的影響。假設(shè)有一個包含10名成員的小群體,他們要決定是否采用某項大膽的新舉措。如果一兩個支持者先發(fā)言,他們很容易使整個團隊轉(zhuǎn)向他們偏好的方向。如果最先發(fā)言的是持懷疑態(tài)度的人,情況也是如此,至少當人們能夠互相影響時是如此。事實上,群體中的成員常常會互相影響,因此,僅僅是因為先發(fā)言的人不同,或者一開始下載某首歌的人更多,類似的群體會做出非常不同的判斷。簡稱為少數(shù)先行者的隨機差異

信息級聯(lián)會導致噪聲出現(xiàn)在多個群體之間,有時出現(xiàn)的可能性甚至非常大。

個體的獨立判斷進行減少了噪聲。

簡單的機械性規(guī)則普遍優(yōu)于人類的判斷。

人類在許多方面都不如統(tǒng)計模型,其中一個主要弱點在于人類的判斷過程存在噪聲。

判斷模型的表現(xiàn)一如既往的勝過判斷者本人。對自己判斷品質(zhì)的滿意度只是一種錯覺,即效度錯覺。

我們不知道這些研究中的參與者是否收到了有關(guān)個人表現(xiàn)的反饋,但是,如果有人告訴你,對你的判斷進行粗略建模后的模型實際上比你本人預測得更準確(這極具諷刺性),想必你會感到非常沮喪。對于大多數(shù)人來說,判斷活動是復雜、豐富且有趣的,這也恰恰是因為它不符合簡單規(guī)則。當我們發(fā)明并應用一些復雜規(guī)則來做判斷或?qū)δ承┌咐辛瞬煌谄渌咐囊娊鈺r,即當我們做出了無法用簡單的加權(quán)求和模型去簡化的判斷時,我們會自我感覺更加良好,對自己的判斷能力更加信心十足。但關(guān)于判斷模型的研究進一步證實了梅爾的結(jié)論——很多細節(jié)都是無用的,復雜性和豐富性并不會使預測更準確。

如果你的復雜規(guī)則行之有效,那么簡單模型會因為不能重復你的規(guī)則而導致自身的預測力下降。例如,假設(shè)你必須從一個人的技能和動機兩個方面來預測他成功完成一項困難任務的可能性,那么加權(quán)平均并非好方法,因為動機再強,也無法彌補能力的不足,反之亦然,如果你使用復雜的預測規(guī)則,那么你的預測準確性將比無法獲取復雜規(guī)則的簡單模型更高。但復雜規(guī)則通常只會給你帶來效度錯覺,這實際上會降低你的判斷品質(zhì)。也就是說,少數(shù)復雜規(guī)則是有效的,但大多數(shù)是無效的。此外,你的簡單模型并不會表征你在判斷中的噪聲,它不能重現(xiàn)你在特定案例中由于隨機反應而產(chǎn)生的正誤差或負誤差。同理,你在做出特定判斷時會受到當時的環(huán)境和心理狀態(tài)的影響,而模型并不會。這些判斷的噪聲帶來的誤差很可能與任何事物都不相關(guān),這意味著在大多數(shù)情況下,我們可以將其視為隨機誤差。

用機器減少噪聲可以提高預測判斷的有效性。你可能會認為自己比一般人更擅長思考,更有洞察力,但實際上只是你的噪聲更多而已。

均等權(quán)重模型具有穩(wěn)定之美。

將兩個或多個相關(guān)預測因素組合后,預測效果相比于單個預測因素并不會好多少。

人們對自己能夠容錯,對算法確不能容錯。如果機器不完美,那就丟棄它。

由于存在這種直覺性的期望,人們?nèi)钥赡懿恍湃嗡惴?,而繼續(xù)相信自己的判斷力,即使自己的判斷明顯不盡如人意。這種態(tài)度是根深蒂固的,除非算法能夠達到近乎完美的預測準確性,否則這是不可能改變的。


然而,對判斷所持有的信心并不能保證判斷的準確性,許多充滿信心的預測都是錯的。盡管偏差和噪聲都會造成預測誤差,但此類誤差最重要的來源并非受限于預測性判斷實際有多好,而是受限于預測性判斷應該有多好。我們將這一局限性稱為“客觀無知”

長期的預測毫無用處。

模型確實比人表現(xiàn)得更好,但并沒有好很多。

我們強烈反對這個詞的另一種用法—一—將代價高昂的失敗歸因于無特定所指的“偏差”,而在承認錯誤的同時,承諾努力消除我們的決策中的偏差。這些表述無非是說“錯誤已經(jīng)鑄成”“我們將努力做得更好”,再沒有其他意義了??梢钥隙ǖ氖?,某些失敗確實是由與特定心理偏差相關(guān)的可預見性誤差引起的,我們也相信采取某些干預措施來減少判斷和決策中的偏差和噪聲是可行的,但是,將所有不好的結(jié)果都歸咎于偏差,是毫無價值的解釋。我們建議,只有在描述具體、可以識別的誤差以及產(chǎn)生這些誤差的機制時,才使用“偏差”一詞。

我們需要具體分析偏差產(chǎn)生的原因,而不是籠統(tǒng)的用這個詞語

啟發(fā)式和偏差計劃的核心思想:回答一個難題的啟發(fā)式是去尋找一個簡單問題的答案。用一個問題代替另一個問題會導致源于可預見性心理假設(shè)的誤差,我們稱之為心理偏差。

到目前為止,我們簡要地介紹了三種偏差,它們的運作方式是不同的:替代偏差會導致我們對證據(jù)不正確地賦權(quán);結(jié)論偏差會導致我們要么繞開證據(jù),要么以曲解的方式考慮它;而過度一致性偏差則會放大初始印象的效果并減少矛盾信息的影響。當然,以上三種類型的偏差都會產(chǎn)生統(tǒng)計偏差,也都會產(chǎn)生噪聲。

我們給他人傳遞信息時,故意添加噪聲,就可以迷惑他人。

有三件事至關(guān)重要。如果做判斷的人受過良好的訓練、更睿智且擁有正確的認知風格,那么他的判斷也會產(chǎn)生更少的噪聲和偏差。換言之,好的判斷取決于你的經(jīng)驗、思維能力,以及你的思考方式。好的判斷者往往經(jīng)驗豐富且充滿智慧,但他們也時刻保持著思維的開放性,愿意接納新的信息。


擅長預測可驗證的某個領(lǐng)域的人,被稱為某個領(lǐng)域?qū)<摇?br>



我們已經(jīng)指出,有一些判斷的效果是無法驗證的。在一定范圍內(nèi),我們不能輕易得知或毫無爭議地確定一些判斷的真正價值,保險核保、刑事判決當屬此類。此外,品酒、文章評分、書評和影評,以及其他數(shù)不勝數(shù)的判斷也屬此類。雖然這些領(lǐng)域的一些專業(yè)人士也被稱為專家,但我們對這些專家所做判斷的信心建立在同行對他的尊重的基礎(chǔ)上。我們將這類專家稱為“尊重型專家”。尊重型專家這一稱謂本身并無冒犯之意,事實上,指出這些專家的判斷的價值無法被準確評估這一點也并非一種批評,因為在很多領(lǐng)域中,情況本就如此。很多教授、學者和管理顧問也是尊重型專家。他們的可信度取決于學生、同行或客戶對他們的尊重程度。在這些領(lǐng)域,乃至更多領(lǐng)域中,某位專家的判斷只能與他們同行的判斷進行比較。


如果你必須挑選一些人來判斷,那么你最優(yōu)選擇那些高智商的人。


事前或預防性地消除偏差的干預措施又可以分為兩大類。在最有前景的方法中,一些方法旨在改變做判斷或決策的環(huán)境。這種改變也被稱為助推,眾所周知,它們的作用是減少偏差的影響,甚至利用偏差做出一個更好的決策。


決策觀察者不好當,并且毫無疑問,在一些組織中,安排決策觀察者也是不現(xiàn)實的。如果最高決策者沒有下定決心去糾正偏差,那么僅僅發(fā)現(xiàn)偏差并沒有用。確實,決策者必須是發(fā)起決策觀察并支持決策觀察者的人。我們當然不建議你自己任命自己為決策觀察者,這樣你既不會贏得朋友,也不能影響他人。


我們稱這種減少噪聲的方法為決策衛(wèi)生。當你洗手的時候,你可能不知道自己到底在預防哪種細菌感染,你只知道洗手是預防各種細菌感染的好方法(不僅在疫情期間如此,平時也應該這樣做)。同樣,遵循決策衛(wèi)生的原則意味著:即使你不知道想要規(guī)避什么樣的錯誤,你也應該采用減少噪聲的策略。


必要的方法論步驟是簡單明了的。它們闡明了一個適用于許多領(lǐng)域的決策衛(wèi)生策略:通過對信息進行排序來限制過早地使用直覺。在所有判斷中,有些信息是相關(guān)的,有些則不是,而且信息并非總是越多越好,在信息有可能誘導鑒定人員過早地根據(jù)直覺下判斷并導致判斷產(chǎn)生偏差時尤其如此。

本著這一精神,為確保鑒定人員判斷的獨立性,司法實驗室采用的新程序只有在鑒定人員需要時,才會向他們提供所需的信息。換言之,實驗室會逐步透露信息,盡可能地讓他們“蒙在鼓里”。因此,德魯爾及其同事設(shè)計的方法被稱為“線性序列揭露”

簡而言之,超級預測者的與眾不同之處不在于他們智力過人,而在于他們明白如何運用智慧。他們運用智慧的技能反映了我們在第18章中描述的那種可能產(chǎn)生更好判斷的認知風格,尤其是高水平的“積極開放性思維”?;叵胍幌玛P(guān)于積極開放性思維的測試:它包括“人們應該考慮與他們的看法相悖的證據(jù)”和“關(guān)注與你意見不同的人比關(guān)注那些與你意見一致的人更有用”。顯然,在這項測試中得分很高的人在新的信息出現(xiàn)時會大大方方地更新自己的判斷,而不會反應過度。

泰特洛克所說:“超級預測者之所以如此優(yōu)秀,不在于他們是誰,而在于他們做了什么—一艱苦的研究工作,仔細的思考和自我批判對其他觀點的收集和匯總,細微的判斷和不懈的更新?!彼麄兿矚g一個特殊的思維循環(huán):嘗試,失敗,分析,調(diào)整,再試一次。


“超級預測者”的成功主要歸功于他們在控制測量誤差方面的出色能力,而不是其他人無法復制的對新聞的透徹解讀。


無論多樣性如何,只有在判斷真正彼此獨立的情況下,對判斷進行匯總才能減少噪聲


各種手冊的出現(xiàn),意在減少噪聲。


關(guān)于減少或消除噪聲的反對意見主要表現(xiàn)在以下7個方面:

第一,減少噪聲的代價很大,不值得。減少噪聲的必要步驟可能非常煩瑣,在某些情況下,甚至無法實現(xiàn)。

第二,為減少噪聲而采用的某些策略可能會給系統(tǒng)本身引入新的錯誤,有時甚至會造成系統(tǒng)性偏差。如果政府部門的所有預測者都過分樂觀,那么他們的預測結(jié)果或許就不只是有噪聲這么簡單了,有可能根本就是錯的。如果醫(yī)院里的所有醫(yī)生針對每一種疾病開的藥都是阿司匹林,那問題就不再是噪聲而是大量誤診了。

第三,如果希望讓人們覺得自己受到尊重和有尊嚴,我們就必須容許一些噪聲的存在。噪聲可能是人們最終樂于接受的不完美過程的副產(chǎn)品,因為這個過程會讓每個人(員工、顧客、求職者、學生、嫌犯等)有機會表達自己的觀點,有機會影響“法官”行使自由裁量權(quán),讓每個人都有可能感受到被他人關(guān)注和傾聽。

第四,噪聲可能是容納新的價值觀乃至促進道德和政治的發(fā)展至關(guān)重要的事物。如果我們消除了噪聲,當?shù)赖潞驼纬兄Z朝著新的、意想不到的方向發(fā)展時,我們做出回應的能力可能被削弱。無噪聲的系統(tǒng)可能會導致價值觀僵化。

第五,一些力圖減少噪聲的策略可能會促成投機取巧的行為,導致人們利用制度的漏洞,或規(guī)避禁令。容許一些噪聲甚至很多噪聲的存在,可能是防止惡行所必需的。

第六,存在噪聲的系統(tǒng)可能有很好的威懾作用。如果人們知道自己受到的懲罰可能很嚴重也可能很輕微,那么他們有可能會盡量避免犯錯,至少對于風險規(guī)避型的人來說是如此。所以說,系統(tǒng)應該保留一些噪聲,讓它們成為一種能產(chǎn)生額外威懾力的方式。

第七,人們不希望自己被當成一件物品或機器上的一個小齒輪。某些減少噪聲的策略可能會限制人們的創(chuàng)造力,并影響團隊士氣。

規(guī)則旨在消除實施者的自由裁量權(quán),而標準則會授予實施者一定的自由裁量權(quán)。

決策衛(wèi)生的6項原則

1判斷的目的在于準確性,而不在于個性化表達。

2使用統(tǒng)計思維,采用外部視角審視個案。

3對判斷進行結(jié)構(gòu)化,將其分解為幾個獨立的任務。

4抵制不成熟的直覺。不必禁用直覺,但直覺應該建立在一定的信息基礎(chǔ)之上。

5獲取多為判斷者的獨立判斷,再考慮匯總這些判斷。

6用相對判斷和相對量表會更好。



噪聲標注的評論 (共 條)

分享到微博請遵守國家法律
西乌| 游戏| 五原县| 常熟市| 东乡| 宁都县| 安庆市| 芜湖市| 楚雄市| 屯昌县| 句容市| 夹江县| 康保县| 涞水县| 海丰县| 沙坪坝区| 南部县| 天峻县| 松潘县| 宁海县| 正安县| 莆田市| 衡东县| 东方市| 县级市| 红河县| 石林| 梁山县| 公主岭市| 大城县| 潞西市| 阳曲县| 天等县| 嘉义市| 朔州市| 鄄城县| 纳雍县| 容城县| 克山县| 军事| 宁河县|