最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

廣告數(shù)據(jù)分析之信息流定向樸素貝葉斯算法

2023-06-14 23:51 作者:老鄧營銷家園  | 我要投稿

前段時間,鄧老師在艾課網(wǎng)講了一節(jié)公開課,主題是《廣告數(shù)據(jù)分析實戰(zhàn)與案例演示》,課程的主要內容是圍繞著廣告數(shù)據(jù)分析到底分析什么、常用的分析方法、常用工具和EXCEL函數(shù)以及實際案例演示來講的。

數(shù)據(jù)分析常用方法為例,有趨勢分析法、比重分析法、TOP N分析法、四象限法、樸素貝葉斯算法、漏斗分析法、多維度拆解分析法、A/B測試分析法、對比分析法、帕累托分析法等等,也有一些朋友是已經(jīng)看完了課程的,希望可以手把手得教導一下,因為最近都有很多的事情在忙,就用公粽號的文章來重點講解一下多數(shù)人問到的這個信息流定向貝葉斯算法,很多朋友說這個信息流的樸素貝葉斯算法還是理解不太透徹,能不能詳細再講講,我這里再重新寫一下關于這個貝葉斯算法的知識點

貝葉斯算法

其實樸素貝葉斯算法只是個高中知識,只要有印象認真看完這篇文章都很容易能理解,并不高深的,但是確實是挺有用的一個數(shù)據(jù)分析方法,除了信息流定向問題如推薦系統(tǒng)、廣告推薦、受眾畫像等,我們生活中常見的核酸檢驗、艾滋病檢查、人工智能、圖像識別、機器翻譯等場景都可以用到的。

看下簡單的例子,朱一明老師提過一個數(shù)學題,已知一家人有倆孩子,并且已知其中一個孩子是女兒,問另外一個孩子也是女兒的概率是多少?大部分人會認為這個概率是1/2,答案是1/3。這里說的是這倆孩子已經(jīng)生出來了,不是說已知生了一個孩子是女兒的情況下,另外再生一個女兒的概率。如果孩子還沒生,我們都知道生孩子是男是女,那這是獨立事件,當然前提我們得知道生男生女的概率,這道題里面只是被假設為是1/2,但倆孩子都生好了,無非就是四種情況,現(xiàn)在你已經(jīng)知道了,其中一個是孩子是女兒,那么就排除了兩個都是男孩的情況,那么就只剩下三種情況,包含至少一個女孩的,那么兩個孩子都是女兒的情況,那就只有一種,所以另外一個孩子也是女兒的概率那就是1/3。如果已知這個女兒是老大,那另外一個孩子也是女兒的概率才是1/2,你也可以說已知一個女兒是老二,那么另外一個孩子也是女兒的概率呢,也是1/2,這個1/2其實跟已知生了一個孩子是女兒,第二個孩子還沒生,問你第二個孩子生女兒的概率是多少,這其實是一樣的,因為在這里生和沒生也是代號,表示狀態(tài)而已,所以是1/2

男生女生

再舉個例子,假如你拋硬幣100次,其中正面向上60次,反面向上40次,問下一次正面向上的概率多少?如果答案是小于0.5,那就叫做賭徒謬誤。假如答案是剛好0.5,那你就是老實人,前后叫做獨立事件,就算連開100次正面,那么下一次開正面的概率還是0.5。其實不對,因為我又沒有說正反兩面材質完全均勻,就算他們是一模一樣不可分辨,那么又怎樣來確定哪一面叫做正面,哪一面叫做反面?如果答案是0.6,那就叫做頻率學派,他們認為前面是怎樣,后面還是那樣,前面十次出現(xiàn)六次,后面還是應該十次出現(xiàn)六次。中規(guī)中矩,但也不會犯大的錯誤。那還有其他答案嗎?貝葉斯說既要表達主觀意見,同時讓這個意見要接受來自于實踐的修正。我們一般認為硬幣正面向上的概率50%,這個叫做先驗概率,而在這個例子中所表現(xiàn)出來的60%叫做經(jīng)驗概率。我們的先驗概率要根據(jù)經(jīng)驗的證據(jù)而做出修正。它的意思是說,我們先估計事情A發(fā)生的概率是,然后知道了一系列跟A有關的事情B已經(jīng)發(fā)生了,然后再根據(jù)事實來反推A可能的概率究竟是多少。貝葉斯公式根據(jù)具體的模型分布推導出下一次硬幣正面向上的概率,代入我們之前的先驗概率0.5和經(jīng)驗概率0.6,按照貝葉斯公式就得出了下一次正面朝上的概率是多少啦!

硬幣

大家平時在刷短視頻的時候經(jīng)常會刷到美女或者自己感興趣的內容也是因為平臺系統(tǒng)的個性化推薦也有結合了貝葉斯算法,基本思想是根據(jù)用戶歷史行為和反饋信息,計算用戶對不同推薦內容的喜歡程度從而提高推薦效果,搶占更多的用戶時長,不同的平臺算法和權重會也有差異,比如小紅書流量推薦規(guī)則的內容標簽匹配社交關系鏈推薦,CES評分體系權重算法是(點贊數(shù)×1+收藏數(shù)×1+評論數(shù)×4+轉發(fā)數(shù)×4+關注數(shù)×8),貝葉斯在計算過程中會對不同特征進行離散化處理,并進行平滑處理,以避免概率值為0的情況,同時,為了提高推薦效果,可以將貝葉斯算法與其他推薦算法,如協(xié)同過濾、基于內容的推薦等,進行結合,從從而實現(xiàn)更精準的推薦優(yōu)化。

流量推薦

而在廣告投放中的信息流投流中,優(yōu)化師通??梢酝ㄟ^廣告定向的各種組合數(shù)據(jù)反推出哪一個才是更好的廣告定向組合,從而優(yōu)先分配更多的預算或出更高的價格去找到更多合適的精準營銷流量轉化,這個算法可以解決我們經(jīng)常遇到的問題,比如已知某條件概率,如何得到兩個事件交換后的概率,也就是在已知P(A|B)的情況下如何求P(B|A)。因為我們很容易可以計算到正向概率,但是反推逆概問題就會比較困難,而通過貝葉斯的逆概率公式就能很便捷的算出來。

我們先來看下貝葉斯的公式:P(A|B)=P(B|A)*P(A)/P(B)那么這個公式是怎么來的呢?

貝葉斯公式

先驗概率:P(A),某個事件A發(fā)生的概率,如公式中的事件A發(fā)生的的概率,初始概率或基礎概率,先驗是因為不用考慮任何B方面因素。

后驗概率:P(A|B),事件A在另一個事件B已經(jīng)發(fā)生的條件下發(fā)生的概率,結合先驗概率和證據(jù)計算之后才知道,也就是修正概率

似然概率:P(B|A),在事件A發(fā)生的情況下,事件B的概率有多大

標準化常量證據(jù):P(B)是B的先驗概率或邊緣概率,也作標準化常量。

后驗概率=(先驗概率*似然概率) /?常數(shù)(貝葉斯決策根據(jù)后驗概率作出決策)

這里主要看(先驗概率*似然概率)大小

那這是怎么推導過來的,其實理解了全概率公式再理解貝葉斯公式就很容易看得懂了,這個貝葉斯公式實際是變形得到的P(A|B)=P(B|A)*P(A)/P(B),因為兩個條件概率P(A|B)?和?P(B|A),按照乘法法則,可以立刻導出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)

全概率公式:知因求果,考察在每一種情況下事件B發(fā)生的概率,計算B的概率

貝葉斯公式:知果求因,在事件B發(fā)生的條件下,考察每種情況出現(xiàn)的條件概率

我們先看下全概率公式

一般設A1,A2,A3...An是一組兩兩互斥的事件,A1∪A2∪A3...∪An=Ω且P(Ai)>0,x=1,2,3...n;對任意事件B

P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+....P(An)P(B|An)


用于將一個復雜事件的概率計算問題,分解若干個簡單事件的概率計算問題,最后應用概率的可加性求出最終結果

然后再看貝葉斯公式

設試驗E的樣本空間為Ω,A為事件,B1,B2,B3...Bn為的一個劃分,且P(A)>0,P(Bi)>0(i=1,2...n),則P(Bi|A)=


推導如下:

條件概率:P(B|A)=P(AB)/P(A)?;P(A|B)=P(AB)/P(B)?

乘法公式:P(AB)=P(A)*P(B|A)=P(B)*P(A|B)?

全概率公式:P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+....P(Bn)P(A|Bn)?

貝葉斯公式:

P(A??B)=P(A|B)P(B)=P(B|A)P(A)

對于簡單的二元示例,只有兩種結果,A可能為01,則根據(jù)貝葉斯公式,有

?


我們也可以通過Python建立模型計算不同用戶點擊廣告的轉化率然后可視化出來計算數(shù)據(jù)就會更便于我們對信息流投放定向的效果調整和優(yōu)化

1 import numpy as np

2 from sklearn.linear_model import LinearRegression

3

4 #?假設用戶興趣數(shù)據(jù)為X,廣告興趣數(shù)據(jù)為Y

5 X = np.array([[1, 'sports'], [2, 'entertainment'], [3, 'technology'], [4, 'health']])

6 Y = np.array([[1, 0.2], [2, 0.3], [3, 0.1], [4, 0.5]])

7

8 #?訓練線性回歸模型

9 model = LinearRegression()

10 model.fit(X, Y)

11

12 #?計算用戶興趣的權重向量

13 weights = model.coef_[0]

14

15 #?計算廣告興趣的權重向量

16 weights_adv = model.coef_[1]

17

18 #?計算轉化率

19 conversion_rate = weights * Y[:, np.newaxis]

20

21 #?計算不同性別、年齡、興趣標簽的用戶點擊廣告的轉化率

22 gender_conversion_rate = weights * (1 - np.abs(Y[:, np.newaxis] - np.array([1, 2, 3])))

23 age_conversion_rate = weights * (1 - np.abs(Y[:, np.newaxis] - np.array([20, 30, 40])))

24 interest_conversion_rate = weights * (1 - np.abs(Y[:, np.newaxis] - np.array(['sports', 'entertainment', 'technology'])))

在上面的代碼中,我們使用了sklearn庫中的LinearRegression類來訓練線性回歸模型。然后,我們使用模型的權重向量來計算不同性別、年齡、興趣標簽的用戶點擊廣告的轉化率。最后,我們可以將轉化率數(shù)據(jù)可視化出來,以便更好地理解和分析數(shù)據(jù)。也可以用API回傳數(shù)據(jù)對信息流定向數(shù)據(jù)進行分類,再用貝葉斯公式計算后驗概率和條件概率,可以使用scikit-learn庫來進行線性回歸分析,同時也可以使用numpy和pandas等庫來進行數(shù)據(jù)處理和可視化。但是上面的這些代碼只是一個簡單的示例,實際應用中可能需要對數(shù)據(jù)進行更加復雜的處理和分析,以獲得更加準確的結果。

Python

假設我們有一個包含信息流定向數(shù)據(jù)的數(shù)據(jù)集,其中每個數(shù)據(jù)點都包含兩個屬性:時間戳定向類別。我們想要對這些數(shù)據(jù)進行分類,將其分為“正在瀏覽”和“正在搜索”兩個類別。

首先,我們需要將數(shù)據(jù)集轉換為一個概率分布。我們可以使用貝葉斯公式來計算每個數(shù)據(jù)點屬于每個類別的概率。假設我們有兩個類別:“正在瀏覽”和“正在搜索”,我們可以使用以下公式計算每個數(shù)據(jù)點屬于每個類別的概率:

P(x?∈?A) = P(x?∈?A | y = 1) * P(y = 1) + P(x?∈?A | y = 0) * P(y = 0)

其中,P(x?∈?A | y = 1)表示x屬于類別A且y為1的概率

P(y = 1)表示y為1的概率

P(x?∈?A | y = 0)表示x屬于類別A且y為0的概率

P(y = 0)表示y為0的概率。

接下來,我們可以使用貝葉斯公式計算每個數(shù)據(jù)點屬于每個類別的后驗概率。假設我們有兩個類別:“正在瀏覽”和“正在搜索”,我們可以使用以下公式計算每個數(shù)據(jù)點屬于每個類別的后驗概率:

P(x?∈?A | y = 1) = P(x?∈?A | y = 1 | z = 1) * P(z = 1) + P(x?∈?A | y = 1 | z = 0) * P(z = 0)

其中,P(x?∈?A | y = 1 | z = 1)表示x屬于類別A且y為1且z為1的概率

P(z = 1)表示z為1的概率

P(x?∈?A | y = 1 | z = 0)表示x屬于類別A且y為1且z為0的概率

P(z = 0)表示z為0的概率。

通過以上步驟,我們可以計算每個數(shù)據(jù)點屬于每個類別的概率后驗概率,并使用它們來進行分類。能看到這里的朋友,想必基本都能理解了,如果不是做數(shù)據(jù)挖掘深度分析,其實信息流廣告多數(shù)情況只需要用到簡單的二元示例,原理也是一樣的,把多組數(shù)據(jù)進行分組計算,無論是定向、創(chuàng)意還是素材,滿足能區(qū)分轉化和未轉化的用戶條件,即可計算出轉化概率來,這些概率有一定的參考和幫助作用,可以將其應用于廣告投放,創(chuàng)造更高的ROI,實際效果調整還是結合賬戶情況來做優(yōu)化的!

鄧老師在艾課網(wǎng)的課程中有這么一個案例問題,大家也可以計算一下或者去艾課網(wǎng)觀看學習更系統(tǒng)的知識!

信息流定向轉化概率題

基于上面的定向轉化數(shù)據(jù)和貝葉斯公式推導:P(A|B)=P(A)*P(B|A)÷P(B)

假設廣告定向X=(性別=“男”,年齡=“35-39歲”,地域=“廣州”)

那么定向為X的用戶轉化1的概率是多少?就是當一個用戶性別男,年齡30-39歲,地域在廣州的用戶看到我們的廣告時,有多大概率可能發(fā)生轉化?

廣告數(shù)據(jù)分析實戰(zhàn)與案例演示

大家有興趣的可以去艾課網(wǎng)購買課程觀看,只需要99元就可以了,但是現(xiàn)在艾課網(wǎng)有一個更優(yōu)惠的套餐,就是299元月度會員解鎖所有課程學習,這個是非常劃算的,因為一個月已經(jīng)可以學習很多其他的課程了,鄧老師這節(jié)課所涉及的內容范圍也是比較廣泛的,要是小白的話很多內容不一定可以馬上消化到,這節(jié)課目錄下面也有很多的相關課程鏈接,購買會員后學習效果會更好!如果單獨去買的話,基本都在99元左右,還有一些更豐富或高階的會更貴一些,艾課網(wǎng)也是希望更多的互聯(lián)網(wǎng)人能夠去系統(tǒng)學習,直接長按圖片掃描下方二維碼即可進入觀看啦!

屆時鄧老師也將會在今年的7月份再次舉辦一堂新的公開課播出,更多課程學習和最新消息請關注老鄧營銷家園公粽號和營業(yè)運營鄧老師蝴蝶號~!

廣告數(shù)據(jù)分析之信息流定向樸素貝葉斯算法的評論 (共 條)

分享到微博請遵守國家法律
故城县| 喀喇| 恭城| 福州市| 安阳市| 安陆市| 宜兰县| 泉州市| 秭归县| 手机| 外汇| 望都县| 临安市| 五常市| 莆田市| 河北区| 连南| 安国市| 彭州市| 九龙坡区| 鱼台县| 吴江市| 黔东| 游戏| 伊吾县| 清涧县| 景谷| 上蔡县| 杭锦后旗| 会同县| 阿拉善盟| 肥东县| 施甸县| 米易县| 比如县| 张北县| 五原县| 洛扎县| 界首市| 咸宁市| 潜江市|