最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)分析幾大常見效應(yīng)和定律

2021-04-28 15:02 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿
來源:數(shù)師兄?
作者:數(shù)師兄

在討論數(shù)據(jù)和業(yè)務(wù)的過程中,如果對方時(shí)不時(shí)蹦出個(gè)這效應(yīng),那定律,自己沒有了解的話會感覺一臉懵!其實(shí)這些概念也沒有什么神秘的,今天整理了一下咱們數(shù)分領(lǐng)域常見的效應(yīng)和規(guī)律,希望可以幫大家。


01

馬太效應(yīng)

馬太效應(yīng)出自圣經(jīng)《新約·馬太福音》里有一則寓言:“凡有的,還要加倍給他叫他多余;沒有的,連他所有的也要奪過來”。中國也有類似的古語,看過83版射雕英雄傳的同學(xué)應(yīng)該對九陰真經(jīng)里面 “天之道,損有余而補(bǔ)不足” 這句話印象深了,這句話出自老子的《道德經(jīng)》。


完整的古語為“天之道,損有余而補(bǔ)不足;人之道則不然,損不足以奉有余”,意思是:自然的法則,是損減有余來補(bǔ)充不足。人類社會世俗的作法卻不然,而是損減貧窮不足來供奉富貴有余。這兩句古語比較直觀地表述了馬太效應(yīng),通俗地解釋為 “強(qiáng)的越強(qiáng),弱的越弱”。


馬太效應(yīng)在業(yè)務(wù)中非常常見。比如在推薦算法中,被判定為質(zhì)量較好的用戶所得到的資源就越多,這種情況也會形成反饋,得到的資源越多越會被判定為質(zhì)量較好的用戶,從而加劇這種效應(yīng)(類似于短視頻點(diǎn)贊越多曝光越多,曝光越多點(diǎn)贊越多)。


02

虹吸效應(yīng)

有些同學(xué)小時(shí)候可能做過這樣的事情,把一根軟管子一頭插入水槽里面,用嘴把水吸出來,然后把軟管子的另一頭放地比水槽里水面低,那么水就能源源不斷地流出來,其中的道理就是虹吸效應(yīng):液態(tài)分子間存在引力與位能差能,使液體會由壓力大的一邊流向壓力小的一邊。在業(yè)務(wù)中的虹吸效應(yīng)指的是,某一主體將資源吸引過去,從而使得自身相比其他主體更加有吸引力,并導(dǎo)致其他主體營養(yǎng)不良的現(xiàn)象。


這與馬太效應(yīng)有相似之處但是并不相同,如果說馬太效應(yīng)通俗理解為“強(qiáng)者越強(qiáng),弱者越弱”,那么虹吸效應(yīng)的通俗解釋為“大樹地下不長草”。強(qiáng)者越強(qiáng)不一定是以犧牲弱者為代價(jià),而虹吸就像一塊干海綿,把周邊的資源吸干,導(dǎo)致周邊沒有資源可用甚至寸草不生。


比如,在勞動力市場,每年985,211畢業(yè)的本科研究生數(shù)量是有限的,大公司用誘人的薪資待遇吸引人才,導(dǎo)致這部分人才大部分流向大公司,小公司則相對較難招聘到這部分畢業(yè)生,這也是一種虹吸現(xiàn)象。


再比如,在渠道投放時(shí),假如渠道投放的總體預(yù)算是固定的,假如增加某一廠商渠道A的費(fèi)用使此渠道的ECPM值(可以理解為廠商對品牌方的一種評價(jià)指標(biāo),ECPM值越高在投放中將獲得更好的資源)上漲,進(jìn)而導(dǎo)致渠道A的成本下降,渠道投放人員就有可能把其他渠道的預(yù)算轉(zhuǎn)移到A,久而久之A渠道的預(yù)算占比會越來越高,其他渠道預(yù)算占比越來越低,長尾的小渠道可能會停止投放。


03

幸存者偏差

幸存者偏差講的目光聚焦于“幸存下來”的群體具備的某些特征,但是忽略了“未幸存下來”的群體是否也是具備相同的特征。這里“幸存”的概念,其實(shí)更合理的說法應(yīng)該是“篩選”。


在二戰(zhàn)中統(tǒng)計(jì)學(xué)家沃德教授曾收到美國軍方邀請,為降低飛機(jī)被擊落的概率提出建議。經(jīng)過觀察發(fā)現(xiàn)機(jī)翼是被擊中最多的地方,而機(jī)尾被擊中概率比較小。當(dāng)時(shí)軍方的指揮官認(rèn)為應(yīng)該加強(qiáng)機(jī)翼的防御,但是沃德教授的結(jié)論是要加強(qiáng)機(jī)尾的防御。原因在于樣本僅統(tǒng)計(jì)了返航的飛機(jī),機(jī)翼被集中多次依然能夠返航說明機(jī)翼并非是致命的地方。機(jī)尾被打中的飛機(jī),會導(dǎo)致引擎受損而無法返航。


04

辛普森悖論

辛普森悖論指的是,當(dāng)對比AB兩個(gè)群體的數(shù)據(jù),并將數(shù)據(jù)拆分成多個(gè)維度時(shí),A組在各個(gè)維度下的表現(xiàn)均好于B,整體A組的表現(xiàn)卻并不一定好于B。


舉一個(gè)栗子,對比AB兩個(gè)競品的留存,將留存拆分成新用戶和老用戶兩部分,競品A新老用戶的留存均高于競品B,但是競品A的整體留存卻低于競品B。


出現(xiàn)這種情況的原因在于兩點(diǎn),第一是兩個(gè)競品新老用戶的占比不一致;第二是競品A老用戶的留存高于競品B新用戶的留存(也可以是競品A新用戶的留存高于競品B老用戶的留存,在此以其中一種情況進(jìn)行說明)。如果競品A老用戶占比高于競品B,那么競品B在老用戶留存累計(jì)的優(yōu)勢就有可能抹平競品B新用戶留存積累的劣勢,使得整體留存高于A。


通俗地講,就好比兩個(gè)拳擊手X,Y對打,Y在各個(gè)方面都比X有優(yōu)勢,如果X采取以牙還牙的策略定是贏不了Y,所以X需要集中優(yōu)勢力量攻打Y的軟肋,雖然X自己也會收到攻擊,但是如果X對Y造成的傷害遠(yuǎn)遠(yuǎn)高于自己可以承受的傷害,就有可能先把Y撂倒。那“農(nóng)村包圍城市,武裝奪取政權(quán)” 是否也是有類似的思想呢?


05

本福特定律


本福特定律,是說一堆從實(shí)際生活得出的數(shù)據(jù)中,以1為首位數(shù)字的數(shù)的出現(xiàn)機(jī)率約為總數(shù)的三成(30.1%),這個(gè)定律至今沒有經(jīng)過一個(gè)嚴(yán)格的證明,他就像是大自然賦予我們的一個(gè)監(jiān)控指標(biāo),當(dāng)一組數(shù)據(jù)不符合本福特定律時(shí),就有理由懷疑數(shù)據(jù)是否造假。所以此定律經(jīng)常用在檢測上市公司財(cái)報(bào)是否造假以及選舉中是否有舞弊現(xiàn)象。


06

帕累托定律

這個(gè)名字大家可能并不熟悉,但是一定聽過二八定律,管理學(xué)家帕累托通過研究大量事實(shí)發(fā)現(xiàn):社會上20%的人占有80%的社會財(cái)富。后來經(jīng)過豐富與發(fā)展這個(gè)定律表述為,在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數(shù),卻是次要的。


比如活躍用戶中僅有20%的付費(fèi)用戶,付費(fèi)用戶中20%的用戶貢獻(xiàn)了80%的收入等等。當(dāng)然20%與80%只是一個(gè)統(tǒng)計(jì)數(shù)據(jù),其實(shí)質(zhì)講的是 “在因和果、努力和收獲之間,普遍存在著不平衡關(guān)系” , 即不平衡關(guān)系存在的確定性和可預(yù)測性。


二八定律告訴我們把精放在更本質(zhì)的事情上,不經(jīng)規(guī)劃地做事情很有可能會浪費(fèi)80%的精力去產(chǎn)出20%的東西。有些同學(xué)在做分析的時(shí)候,可能有這種感受,跑了n個(gè)sheet的數(shù)據(jù),結(jié)果寫報(bào)告的時(shí)候,只用了四五個(gè)數(shù)據(jù)。所以在分析的習(xí)慣是先思考產(chǎn)生問題的原因,并對每個(gè)可能的原因賦予權(quán)重,然后以最簡單快捷地方式來驗(yàn)證各個(gè)原因,快速排除錯(cuò)誤方向,而不是在每個(gè)原因上都做詳細(xì)的解釋。


以上。

關(guān)注我即刻了解更多數(shù)據(jù)分析知識

更多數(shù)據(jù)分析內(nèi)容

掃描碼即可了解


數(shù)據(jù)分析幾大常見效應(yīng)和定律的評論 (共 條)

分享到微博請遵守國家法律
大姚县| 枞阳县| 祁东县| 海宁市| 安图县| 晋城| 贵港市| 江安县| 清河县| 永平县| 汝南县| 浦城县| 渭南市| 泰宁县| 乌拉特前旗| 慈利县| 江城| 封开县| 丰顺县| 延津县| 蒲江县| 沁源县| 通州市| 冕宁县| 西藏| 南丹县| 南开区| 方城县| 昭觉县| 本溪市| 民和| 宜都市| 华容县| 英吉沙县| 双桥区| 松溪县| 新平| 永和县| 密山市| 石门县| 宝应县|