《大數(shù)據(jù)時代》圖書筆記
2019-09-09 23:49 作者:wutiantian吳甜甜 | 我要投稿

第3章 更好:不是因果關(guān)系,而是相關(guān)關(guān)系

一、人的天性會傾向于追求因果關(guān)系
人有兩種思維模式:
不費力的快速思維,通過這種方式,幾秒鐘就能得到一個結(jié)果。
比較費力的慢性思維,對于特定的問題,需要仔細(xì)琢磨,考慮到位。
第一種思維模式使人們偏向用因果關(guān)系來看待周邊的一切,即使這種關(guān)系并不存在。這種思維方式能夠幫助人們在信息匱乏但又必須作出快速決定的情況下化險為夷,即使而慢條斯理的思考則更容易置身于險境之中。因此,從生物演進的角度,第一種思維模式占據(jù)了上風(fēng)。
即使沒有因果關(guān)系,我們也習(xí)慣與臆想出一個因果關(guān)系,這是一種認(rèn)知方式,與文化背景、生長環(huán)境和教育水平不相關(guān)。當(dāng)看到事情接二連三的發(fā)生,我們也會習(xí)慣性的從因果關(guān)系來看待他們,比如善有善報,惡有惡報。

因果關(guān)系之外的另一個重要關(guān)系,則是相關(guān)關(guān)系。
因果關(guān)系關(guān)心“為什么”,而相關(guān)關(guān)系則關(guān)心“是什么”。
在大數(shù)據(jù)時代,數(shù)據(jù)不再匱乏,但不可否認(rèn)的是,社會活動也變得更加復(fù)雜,不可琢磨。在很多領(lǐng)域,知道“為什么”可能是有用的,但可能沒有那么有用;反而知道“是什么”,
不僅可以高效的解決當(dāng)下問題,還可以對未來進行一定的預(yù)測。
相關(guān)關(guān)系通過識別有用的關(guān)聯(lián)物來幫助人們分析一個現(xiàn)象,而不是揭示其內(nèi)部機理。相關(guān)關(guān)系強,可能僅僅是一種巧合,也就是說,相關(guān)關(guān)系不談絕對性,只談可能性。比如對于沃爾瑪,它發(fā)現(xiàn)當(dāng)季節(jié)性颶風(fēng)來臨之前,手電筒和蛋撻的銷售都上升了,這是為什么,他們之間有一個數(shù)學(xué)公式嗎,這個公式還能推導(dǎo)出其他結(jié)論嗎?這個問題的答案對于沃爾瑪?shù)慕?jīng)理來說并不重要,他要做的就是在合適的時機,把這兩種商品擺在一堆兒,以便行色匆匆的顧客將兩種商品都購買走。
也就是說,如果能夠知道因果關(guān)系固然也好,但如果能夠指導(dǎo)我下一步該做些什么,也就足夠了。
但并不是說因果關(guān)系不重要,不值得探尋,這只是以為大數(shù)據(jù)建立在務(wù)實的基礎(chǔ)上,能夠?qū)㈩A(yù)測的效果與成本控制在合理匹配的程度,能夠支撐商業(yè)決策就是最大的價值。
因果關(guān)系的證明本身就是一道難題,你需要進行不斷的實驗,在實驗過程中還要考慮誘因,要盡可能排除誘因的干擾。因此絕對的因果關(guān)系是很難斷定的,這也在物理學(xué)、化學(xué)、數(shù)學(xué)、生物學(xué)等學(xué)科研究上已經(jīng)有充足的案例。
而在大數(shù)據(jù)時代,證明相關(guān)關(guān)系在耗時耗物上都會更少,因為以大量的數(shù)據(jù)作為基礎(chǔ),事實勝于雄辯,假設(shè)帶來的偏見因素更容易被發(fā)現(xiàn),也就使得結(jié)論更趨于真實的情況。好比在小數(shù)據(jù)時代,經(jīng)濟學(xué)家和政治家一直認(rèn)為收入水平和幸福感是正比。但擁有大量數(shù)據(jù)基礎(chǔ)后會發(fā)現(xiàn),收入水平在某個水平之下,幸福感才和收入水平成正比;超過這條線,幸福感并沒有呈現(xiàn)出和收入水平有明顯正比的情況。因此政治家在制定政策之時,就可能對這兩類人群進行差異化對待,而不是一味的提高社會的收入水平。
標(biāo)簽: