道德淪喪!為什么總分第 1 卻不是優(yōu)秀員工?| 《簡(jiǎn)單統(tǒng)計(jì)學(xué)》讀書筆記
我部門有一個(gè)客服叫飛飛。飛飛是一個(gè)聰明伶俐的小姑娘,在客服團(tuán)隊(duì)里面,她的績(jī)效總是最好的。
但是有一次,人資找我說,上個(gè)月飛飛的績(jī)效大幅下降,認(rèn)為飛飛狀態(tài)不穩(wěn)定。
我很詫異,因?yàn)槲颐總€(gè)月都會(huì)和手底下的小朋友們進(jìn)行溝通,在我看來飛飛的狀態(tài)很穩(wěn)定,績(jī)效也沒什么問題。
人資給我看了績(jī)效表,我發(fā)現(xiàn)了問題所在。
從總體看,飛飛的績(jī)效確實(shí)不是最好的,比第一名的轉(zhuǎn)化率差了很多。

但是,從單項(xiàng)看,飛飛每一項(xiàng)的績(jī)效都超過第一名,為什么呢?

這其實(shí)是辛普森悖論:當(dāng)聚合數(shù)據(jù)被分解時(shí)其中的模式發(fā)生逆轉(zhuǎn)的現(xiàn)象。
這句話反過來也成立:在分組比較中都占優(yōu)勢(shì)的一方,在總評(píng)中有時(shí)反而是失勢(shì)的一方。
《簡(jiǎn)單統(tǒng)計(jì)學(xué)》里面說,產(chǎn)生辛普森悖論的原因,是存在混雜因素:
混雜因素常常出現(xiàn)在使用觀測(cè)性數(shù)據(jù)的研究中,因?yàn)槿藗儫o法通過現(xiàn)實(shí)的方法使這些因素維持恒定。
在飛飛的案例中,混雜因素就是不同溝通類型的數(shù)量。
一般情況下,電話和在線溝通工具的轉(zhuǎn)化率相差很大,電話轉(zhuǎn)化率高,IM轉(zhuǎn)化率低。

雖然飛飛的各項(xiàng)轉(zhuǎn)化率都超過第一名,但是因?yàn)樯蟼€(gè)月接入了太多的IM咨詢,拉低了整體的轉(zhuǎn)化率。

而IM咨詢太多的原因,是我上個(gè)月對(duì)投放渠道和策略進(jìn)行了調(diào)整,然后給飛飛分配了更多的IM咨詢。
所以,即使整體的轉(zhuǎn)化率沒那么高,飛飛依舊是我最好的客服。
對(duì)于數(shù)據(jù)的統(tǒng)計(jì)分析,辛普森悖論是個(gè)常見的現(xiàn)象?!逗?jiǎn)單統(tǒng)計(jì)學(xué)》里面舉了幾個(gè)有趣的例子:
1. 阿拉斯加航空公司在五個(gè)機(jī)場(chǎng)的準(zhǔn)點(diǎn)記錄都超過競(jìng)爭(zhēng)對(duì)手,但總體準(zhǔn)點(diǎn)記錄卻不如競(jìng)爭(zhēng)對(duì)手,為什么呢?
2. 瑞典各個(gè)年齡段的女性死亡率都要低于哥斯達(dá)黎加,但瑞典女性總體死亡率卻高于哥斯達(dá)黎加,為什么呢?
3. 一種手術(shù)對(duì)于小型和大型腎結(jié)石的治療成功率都高于另一種手術(shù),但總體成功率卻更低,為什么呢 ?
因?yàn)檫@些例子里面,都有某種混雜因素對(duì)聚合數(shù)據(jù)產(chǎn)生了影響,導(dǎo)致結(jié)論反轉(zhuǎn)。
如果你對(duì)這些例子的原因感興趣,可以看下《簡(jiǎn)單統(tǒng)計(jì)學(xué)》這本書。
辛普森悖論的這種結(jié)論反轉(zhuǎn)的特性,特別容易誤導(dǎo)人,比如開頭的飛飛案例。
當(dāng)然,你也可以利用這種反轉(zhuǎn)特性去誤導(dǎo)別人。
杰拉爾德·福特?fù)?dān)任美國(guó)總統(tǒng)期間,推行減稅政策,各個(gè)收入群體的稅率都是下降的。

但是從整體看,稅率卻是提高的。

因?yàn)槔U稅的主力是高收入人群,但他們的稅率降低的很少,而且在1978年,高收入人群的稅收占比大幅提高了,最終拉高了整體的稅率。

如果你打算競(jìng)選下一期的美國(guó)總統(tǒng),或許就可以拿著整體稅率提高的數(shù)據(jù),去打擊福特,說他是表里不一的騙子。既然辛普森悖論這么容易誤導(dǎo)人,我們?cè)撛趺幢苊庑疗丈U撃??一個(gè)比較有效的方法,是對(duì)數(shù)據(jù)進(jìn)行合理的細(xì)分。關(guān)注細(xì)分?jǐn)?shù)據(jù),而不是聚合數(shù)據(jù)。
很多時(shí)候整體聚合的數(shù)據(jù)并沒有太多的應(yīng)用價(jià)值。
比如客服的轉(zhuǎn)化率、產(chǎn)品的續(xù)費(fèi)率、用戶的留存率、廣告的點(diǎn)擊率等等。
一個(gè)客服的整體轉(zhuǎn)化率差,并不能說明這個(gè)客服的能力不行,把溝通類型細(xì)分之后,可能發(fā)現(xiàn)是她進(jìn)行了太多難以轉(zhuǎn)化的溝通。
一個(gè)產(chǎn)品的整體留存率不高,未必需要全盤放棄,把設(shè)備類型、用戶類型進(jìn)行細(xì)分之后,說不定能找到有很高忠誠(chéng)度的用戶。
一個(gè)廣告的點(diǎn)擊率不高,未必是創(chuàng)意、著陸頁的原因,把流量細(xì)分之后,可能發(fā)現(xiàn)是引入了太多的非目標(biāo)用戶。
所以,看到數(shù)據(jù)之后別著急下結(jié)論,先細(xì)分一下,說不定會(huì)發(fā)生結(jié)論反轉(zhuǎn)。
—·?End?·—
讀書,思考,學(xué)以致用。
最近讀了什么書?有什么想法?
把你的想法,以?#讀《***》#?的形式留言
和我們一起分享吧