【白話數(shù)據(jù)分析】聊聊“幸存者偏差”與“隨機對照實驗”
01
舉個栗子
場景1:小時候更優(yōu)秀,成年后越來越平庸?
你是否覺得小時候的自己更優(yōu)秀,而成年后的自己正在變得越來越平庸?你也許只是被隨機性欺騙了。想一想吧,每一次升學和就業(yè),你身邊的人都換了一茬兒。如果你曾經(jīng)是某一個團體里的佼佼者,那么你就會跟其他群體里的佼佼者被分到一塊兒。在新的團體里,大家都同樣優(yōu)秀,你也就更容易顯得普通,但這不過是假象罷了。只需要看一看頂級名校學生的自我評價,你就會發(fā)現(xiàn)人類是多么容易被隨機性蒙蔽雙眼,這些經(jīng)過激烈競爭而突圍的年輕竟然經(jīng)常覺得自己智力欠缺,他們要做的只不過是多接觸其他學校的人。
場景2:上了大學又怎樣?還沒打工掙得多?
過年回家會不會被其他人說,上了大學又怎樣?還沒有我打工掙得多?
如今很多人在說,誰誰誰當初沒好好上學如今照樣掙大錢,而好多用功讀書的人,畢業(yè)后反而不如那些沒好好學習的人混得好。并且因為這樣的例子有很多,所以很多人得出“上學沒有用處”,“讀書無用”的結論。
這些其實只是個例,因為基數(shù)太大,所以看起來有很多。2010年第六次全國人口普查的官方口徑,可以算出來大專以上文化程度的人口僅占總人口的8.7%左右??梢钥闯鰧W歷低的人數(shù)遠高于學歷高的人數(shù),所以即便低學歷者成功率遠低于高學歷者,也照樣會導致低學歷者出現(xiàn)大批成功人士。
對于高學歷者,普通人既會關注成功的人,也會關注那些沒成功的人,并且高學歷卻落魄的人尤其受關注,容易被當作新聞報道;而對于低學歷者,普通人往往只關注成功者,忽視了廣大學歷低又沒成功的人。正是因為忽視了這些“沉默的數(shù)據(jù)”,才產生「讀書無用」這種錯誤結論。
貌似“卑之無甚高論”,但是你真的看懂了嗎,其核心問題是“我們需要重點研究那些非幸存者”,因為無法生存下去是系統(tǒng)性風險,我們需要先保證生存下來才能談發(fā)展,而過多關注“幸存者”只不過是錦上添花而已。
02
什么是“幸存者偏差”?
幸存者偏差是指:
當研究一種事件或現(xiàn)象時,只對幸存者進行研究而忽略那些未幸存下來的人或事物,可能會導致對結果的偏差。
當我們評估一個系統(tǒng)、產品、組織或者行業(yè)時,僅考慮它們現(xiàn)存的元素,忽略了曾經(jīng)存在但已經(jīng)失敗的元素。這種情況導致我們誤以為現(xiàn)存元素比實際上更具代表性,因此偏向于低估系統(tǒng)的失敗率。
幸存者偏差產生的原因:
數(shù)據(jù)丟失:在這種情況下,未幸存下來的人或事物的數(shù)據(jù)可能不存在,因此無法對其進行研究。
選擇偏差:在這種情況下,研究者可能會主觀地選擇對幸存者進行研究,而忽略未幸存者。
幸存者偏差的影響:
對結論的偏差:因為只研究幸存者,可能得出錯誤的結論,因此忽略了關鍵信息。
對決策的影響:幸存者偏差也可能影響決策,因為決策者可能根據(jù)錯誤的結論做出錯誤的決策。
03
如何避免“幸存者偏差”?
如何避免幸存者偏差?有以下一些建議:
獲取全面的數(shù)據(jù):研究者應該對所有可用的數(shù)據(jù)進行研究,以避免偏差。
避免選擇偏差:研究者應該避免主觀地選擇對幸存者進行研究,而應該以客觀的方式對所有數(shù)據(jù)進行研究。
正確評估風險:研究者應該正確評估風險,以避免對結果產生偏差。
關注未幸存者:研究者應該關注未幸存者,以避免偏差。
總體而言,避免幸存者偏差需要研究者具有全面的數(shù)據(jù),客觀的分析方法和正確評估風險的能力。只有在所有這些方面都得到考慮時,才能得出準確的結論和做出正確的決策。
04
如何設計隨機對照實驗?
要設計科學有效的隨機對照實驗,請遵循以下步驟:? 定義研究問題:正在測試什么,假設是什么??
確定研究人群:正在研究誰或什么??
將參與者隨機分配到治療組和對照組:這有助于確保各組之間的任何差異都是由于治療而不是其他因素造成的。?
對治療組進行治療并觀察:這可能涉及給藥、使用特定療法或將參與者暴露于特定環(huán)境因素。?
比較治療組和對照組之間的結果:這樣做是為了確定治療是否有效以及假設是否得到支持。?
例子
一位研究人員想要確定一種新的降壓藥是否有效。 1. 研究問題:與安慰劑相比,新藥是否能有效降低血壓? 2. 研究人群:高血壓成人? 3. 隨機分配:參與者被隨機分配接受新藥或安慰劑。 4.給藥:治療組的參與者服用新藥,而對照組的參與者服用安慰劑。 5. 結果比較:研究人員在一段時間后測量兩組的血壓,并比較結果以確定新藥與安慰劑相比是否能有效降低血壓。
05
總結
研究成功者往往比較簡單,因為大家都在研究,很容易就產生了共識,但不是那么成功或者失敗者則鮮有人關注,或者泛泛而談,因為多數(shù)人認為沒成功有什么好學的。這個觀點自然有它的道理,但是從博弈論的角度而言,研究大家都在研究的東西收益較低。 信息的價值在于你比別人多知道一些或者比別人先知道。著重研究別人沒注意到的信息,收益更大,宏觀上講,這叫逆向思維。我們砥礪前行,我們試圖去看清事物真相,但我們往往會停留在事物的表面現(xiàn)象,停留在解決表面問題或者容易解決的問題,對未知的事物充滿恐懼和困惑。