Python 數(shù)據(jù)分析和業(yè)務(wù)應(yīng)用實(shí)戰(zhàn)——廣告投放、產(chǎn)品運(yùn)營(yíng)、商業(yè)分析
鏈接:https://pan.baidu.com/s/186jG7Vds4h-wi4LR09myPw?pwd=znn3?
提取碼:znn3

本書內(nèi)容以技術(shù)知識(shí)與業(yè)務(wù)實(shí)戰(zhàn)相結(jié)合,同時(shí)全書穿插多個(gè)實(shí)戰(zhàn)項(xiàng)目,從而幫助讀者更好地理解數(shù)據(jù)分析技術(shù)在業(yè)務(wù)上的應(yīng)用。前半部分為技術(shù)章節(jié),主要圍繞 Python 語言的編程方法展開,其中包括數(shù)據(jù)錄入、數(shù)據(jù)可視化、數(shù)值計(jì)算、辦公自動(dòng)化等內(nèi)容 ;后半部分為業(yè)務(wù)章節(jié),主要圍繞不同業(yè)務(wù)場(chǎng)景的分析方法展開,其中包括廣告投放、電商運(yùn)營(yíng)、用戶畫像、商品畫像、商業(yè)分析等內(nèi)容。
本書主要面向電商數(shù)據(jù)分析師和電商運(yùn)營(yíng)人員,也適合對(duì)技術(shù)感興趣的產(chǎn)品經(jīng)理。
作者簡(jiǎn)介
周景陽
貪心科技聯(lián)合創(chuàng)始人
曾就職于百度、國(guó)美等大型互聯(lián)網(wǎng)公司及傳統(tǒng)行業(yè)10余年工作經(jīng)驗(yàn),擅長(zhǎng)數(shù)據(jù)分析、數(shù)據(jù)挖掘、大數(shù)據(jù)、軟件研發(fā)、測(cè)試等多方向?qū)崙?zhàn)技術(shù)。
葉鵬飛
電子商務(wù)領(lǐng)域書籍銷量TOP 10作者,代表作《亞馬遜跨境電商數(shù)據(jù)化運(yùn)營(yíng)指南》個(gè)人IP“旭鵬”,在知乎、喜馬拉雅、今日頭條等內(nèi)容平臺(tái)擁有數(shù)據(jù)分析、電子商務(wù)關(guān)注者超過5萬人先后于亞馬遜、bilibili、騰訊擔(dān)任數(shù)據(jù)與運(yùn)營(yíng)相關(guān)工作亞馬遜中國(guó)官方跨境電商廣告業(yè)務(wù)講師、騰訊課堂“數(shù)據(jù)分析師”專業(yè)課程業(yè)務(wù)模塊主講人。
目錄
文件處理
1.1 基本環(huán)境介紹 /1
1.2 Pandas 文件的讀取 /1
1.3 初識(shí) DataFrame 數(shù)據(jù)類型 /3
1.4 DataFrame 數(shù)據(jù)類型的訪問 /5
1.4.1 如何使用 head() 方法查看數(shù)據(jù) /5
1.4.2 如何查看數(shù)據(jù)類型 /6
1.4.3 如何同時(shí)訪問多列數(shù)據(jù) /7
1.4.4 如何進(jìn)行數(shù)據(jù)類型的篩選 /7
1.5 區(qū)域訪問的方法 /8
1.6 DataFrame 數(shù)據(jù)類型的新增、刪除 /11
1.6.1 DataFrame 數(shù)據(jù)類型的新增操作方法 /11
1.6.2 DataFrame 數(shù)據(jù)類型的刪除操作方法 /13
1.7 探索性分析項(xiàng)目實(shí)戰(zhàn) /15
企業(yè)數(shù)據(jù)分析與挖掘項(xiàng)目標(biāo)準(zhǔn)化流程
2.1 基本流程介紹 /22
2.2 如何進(jìn)行目標(biāo)定義 /23
2.2.1 在線產(chǎn)品 /23
2.2.2 線下服務(wù)業(yè) /23
2.2.3 內(nèi)部分析目標(biāo) /24
2.3 數(shù)據(jù)的來源與獲取 /25
2.4 數(shù)據(jù)抽樣的常用方法 /25
2.5 數(shù)據(jù)探索的目標(biāo)與任務(wù) /26
I
2.6 數(shù)據(jù)預(yù)處理 /28
2.7 數(shù)據(jù)建模與評(píng)價(jià) /29
使用 Python 進(jìn)行科學(xué)運(yùn)算
3.1 Pandas 計(jì)算利器 Series /30
3.1.1 DataFrame 與 Series 的關(guān)系 /30
3.1.2 聲明一個(gè) Series 類型 /31
3.1.3 Series 判斷缺失值 /32
3.1.4 Series 的運(yùn)算 /33
3.2 一個(gè)必不可少的運(yùn)算庫 NumPy /34
3.3 類型推斷 /35
3.4 NumPy 的矢量化操作 /36
3.5 NumPy 的切片 /37
3.6 花式索引 Fancy Indexing /39
3.7 降維運(yùn)算 /41
3.8 堆疊運(yùn)算 /42
3.9 廣播運(yùn)算 /44
Matplotlib 數(shù)據(jù)可視化
4.1 銷售額走勢(shì)的折線圖 /48
4.1.1 環(huán)境安裝及引入 /48
4.1.2 Excel 中整數(shù)日期的處理 /49
4.1.3 繪制簡(jiǎn)單折線圖 /50
4.1.4 解決 x 軸刻度重疊問題 /51
4.1.5 調(diào)整畫布大小問題 /52
4.1.6 多項(xiàng)數(shù)據(jù)對(duì)比繪制折線圖 /52
4.2 長(zhǎng)尾分布的柱狀圖 /55
4.2.1 簡(jiǎn)單柱狀圖 /55
4.2.2 邊框顏色與隱藏問題 /56
4.2.3 刻度顯示問題 /57
II
4.3 躺著的柱狀圖就是條形圖 /58
4.4 說明占比的餅圖 /60
4.4.1 基本餅圖 /60
4.4.2 餅圖的數(shù)據(jù)計(jì)算 /60
4.4.3 豐富餅圖屬性 /61
4.5 觀察分布的散點(diǎn)圖 /63
4.5.1 普通散點(diǎn)圖 /63
4.5.2 由散點(diǎn)圖到氣泡圖的演變 /63
4.5.3 自開發(fā) RGB 顏色生成器 /64
全面了解 MySQL
5.1 掌握數(shù)據(jù)庫的結(jié)構(gòu) /66
5.1.1 實(shí)例與庫 /66
5.1.2 表與字段的創(chuàng)建 /70
5.2 SQL 的數(shù)據(jù)操作 /72
5.2.1 數(shù)據(jù)寫入 /72
5.2.2 數(shù)據(jù)更新 /73
5.2.3 數(shù)據(jù)的物理刪除與邏輯刪除 /74
5.3 使用 Python 操作 MySQL /75
5.3.1 表結(jié)構(gòu)的創(chuàng)建 /75
5.3.2 外部數(shù)據(jù)導(dǎo)入 /76
使用 Python 進(jìn)行 SQL 的查詢與計(jì)算
6.1 有條件限制的查詢語句 /78
6.1.1 基本查詢語句 /78
6.1.2 單一條件限制的查詢語句 /79
6.1.3 模糊的條件限制 /81
6.1.4 多條件限制的查詢語句 /82
6.1.5 關(guān)于空值的判斷 /83
6.1.6 返回部分結(jié)果的控制 /84
III
6.2 多個(gè)表查詢結(jié)果展示在一起的聯(lián)合查詢 /85
6.3 統(tǒng)計(jì)結(jié)果中的分組方法與篩選技巧 /86
6.3.1 掌握結(jié)果分組 /86
6.3.2 過濾篩選分組后的結(jié)果 /87
6.3.3 排序中的大小順序 /89
6.4 多表之間的子查詢 /90
6.4.1 兩表之間的子查詢 /90
6.4.2 三表之間的子查詢 /91
6.5 多表之間的關(guān)聯(lián)查詢 /92
6.5.1 先給數(shù)據(jù)起個(gè)別名 /92
6.5.2 兩表之間的左關(guān)聯(lián) /93
6.5.3 兩表之間的右關(guān)聯(lián) /94
6.5.4 兩表之間的全關(guān)聯(lián) /95
6.6 使用 Python 進(jìn)行 SQL 數(shù)據(jù)查詢 /95
6.6.1 一般的查詢方法 /95
6.6.2 使用 Pandas 的查詢方法 /96
基于用戶行為的用戶價(jià)值分析
7.1 項(xiàng)目數(shù)據(jù)介紹 /98
7.1.1 項(xiàng)目介紹及脫敏 /98
7.1.2 數(shù)據(jù)介紹 /98
7.2 項(xiàng)目開始前的數(shù)據(jù)預(yù)處理 /100
7.2.1 數(shù)據(jù)獲取 /100
7.2.2 數(shù)據(jù)預(yù)處理 /101
7.3 指標(biāo)分析與價(jià)值分析 /102
7.3.1 流量指標(biāo)分析 /102
7.3.2 轉(zhuǎn)化指標(biāo)分析 /104
7.3.3 基于 RFM 模型的用戶價(jià)值分析 /104
IV
數(shù)據(jù)分析的具體介紹
8.1 數(shù)據(jù)與信息的關(guān)系 /107
8.2 數(shù)據(jù)能做什么——以微信私域流量數(shù)字化經(jīng)營(yíng)為例 /108
8.3
數(shù)據(jù)分析基本概念及數(shù)學(xué)基礎(chǔ)
9.1 數(shù)據(jù)分析的基本思路 /119
9.2 描述性分析 /120
9.2.1 數(shù)值分析 /120
9.2.2 分布分析 /121
9.2.3 可視化分析 /124
9.3 診斷性分析 /129
9.3.1 關(guān)聯(lián)分析 /129
9.3.2 波動(dòng)分析(以周權(quán)重指數(shù)為例) /130
9.4 預(yù)測(cè)性分析 /131
9.4.1 線性回歸 /131
9.4.2 非線性回歸 /133
9.5 仿真模擬 /136
9.5.1 仿真模擬的理論應(yīng)用 /136
9.5.2 仿真模擬的業(yè)務(wù)應(yīng)用 /137
V
數(shù)據(jù)分析思維在業(yè)務(wù)中的應(yīng)用——以 B 站廣告增長(zhǎng)投放為例
10.1 B 站基本信息及廣告形式 /144
10.1.1 B 站基本信息 /144
10.1.2 B 站的廣告形式 /145
10.2 影響 CPC 廣告投放效果的要素 /147
10.2.1 廣告投放營(yíng)銷漏斗轉(zhuǎn)化模型 /147
10.2.2 CPC 廣告展示量(曝光量)涉及要素 /148
10.2.3 CPC 廣告點(diǎn)擊量涉及要素 /153
10.2.4 CPC 廣告訪問量涉及要素 /157
10.2.5 CPC 廣告成交量(轉(zhuǎn)化量)涉及要素 /157
10.3 B 站內(nèi) CPC 廣告業(yè)務(wù)場(chǎng)景與優(yōu)化 /159
10.4 B 站內(nèi) CPC 廣告業(yè)務(wù)優(yōu)化思路與數(shù)據(jù)分析 /160
10.4.1 針對(duì)廣告投放 ROI 偏低問題的數(shù)據(jù)匯總 /160
10.4.2 針對(duì)廣告投放 ROI 偏低問題的優(yōu)化思路 /161
10.4.3 針對(duì)廣告曝光點(diǎn)擊率偏低問題的業(yè)務(wù)背景 /164
10.4.4 針對(duì)廣告曝光點(diǎn)擊率偏低問題的優(yōu)化思路 /165
10.5 B 站內(nèi) CPC 廣告優(yōu)化在復(fù)雜業(yè)務(wù)環(huán)境下考慮的要素 /168
數(shù)據(jù)分析在電商平臺(tái)訂單分析中的應(yīng)用——以 B 站會(huì)員購電商平臺(tái)為例
11.1 B 站會(huì)員購平臺(tái)業(yè)務(wù)背景介紹 /172
11.2 B 站會(huì)員購平臺(tái)相關(guān)數(shù)據(jù)介紹 /173
11.3 訂單數(shù)據(jù)的數(shù)據(jù)分析基本思路 /175
11.4 B 站會(huì)員購時(shí)間相關(guān)訂單數(shù)據(jù)的分析思路及業(yè)務(wù)應(yīng)用 /178
11.4.1 訂單時(shí)間分布分析 /178
11.4.2 訂單價(jià)格分布分析 /179
11.4.3 訂單時(shí)間分布與價(jià)格分布的交叉分析 /180
11.4.4 不同時(shí)間相關(guān)訂單數(shù)據(jù)的分析匯總 /180
VI
11.5 B 站會(huì)員購商品相關(guān)訂單數(shù)據(jù)的分析思路及業(yè)務(wù)應(yīng)用 /181
11.5.1 商品客單價(jià)分布分析 /181
11.5.2 商品銷量分布分析 /182
11.5.3 商品銷量波動(dòng)趨勢(shì)分析 /183
11.5.4 商品地區(qū)客單價(jià)分析 /185
11.6 B 站會(huì)員購多日訂單數(shù)據(jù)的匯總 /186
11.7 B 站會(huì)員購訂單數(shù)據(jù)針對(duì)地區(qū)品牌滲透度基本判別的分析 /186
數(shù)據(jù)分析在商業(yè)分析中的應(yīng)用——以商品多渠道管理為例
12.1 什么是商業(yè)分析 /190
12.2 商業(yè)分析和數(shù)據(jù)分析的區(qū)別是什么 /190
12.3 多渠道商業(yè)分析項(xiàng)目背景介紹 /193
12.4 相關(guān)數(shù)據(jù)介紹 /196
12.5 多渠道商業(yè)分析的數(shù)據(jù)處理 /198
12.5.1 多渠道商業(yè)分析的數(shù)據(jù)背景及分析價(jià)值 /198
12.5.2 多渠道商業(yè)分析的操作步驟 /200
12.5.3 多渠道商業(yè)分析的數(shù)據(jù)分析思路及操作 /200
12.6 不同渠道對(duì)銷量影響程度的判斷 /209
12.7 多渠道商業(yè)分析在銷售管理上的應(yīng)用 /211
數(shù)據(jù)分析在市場(chǎng)調(diào)研的應(yīng)用——商品畫像分析
13.1 什么是商品畫像體系 /212
13.2 商品畫像體系的數(shù)據(jù)來源 /212
13.2.1 平臺(tái)數(shù)據(jù)來源 /212
13.2.2 第三方數(shù)據(jù)來源 /220
13.3 商品畫像數(shù)據(jù)的抓取方法 /223
13.3.1 人工采集 /223
13.3.2 第三方爬蟲工具采集 /223
13.3.3 自有編程爬蟲腳本采集 /224
VII
13.4 商品畫像體系的應(yīng)用 /225
13.4.1 數(shù)據(jù)維度說明 /225
13.4.2 數(shù)據(jù)清洗及有效數(shù)據(jù)篩選 /228
13.4.3 商品曝光價(jià)格分布分析 /229
13.4.4 商品曝光價(jià)格趨勢(shì)分析 /230
13.4.5 商品評(píng)分及數(shù)量分布分析 /231
13.4.6 商品評(píng)分趨勢(shì)分析 /235
13.4.7 商品排名分布趨勢(shì)分析 /236
13.4.8 商品標(biāo)題詞頻分析 /237
13.4.9 商品評(píng)價(jià)詞頻分析 /244
查看全部↓
前言/序言
獻(xiàn)給陪伴我的朋友、家人,以及我所熱愛的事業(yè)
隨著互聯(lián)網(wǎng)行業(yè)的發(fā)展,被稱為新時(shí)代能源的數(shù)據(jù)顯得愈發(fā)重要,無論是千人千面的淘寶,還是個(gè)性化推薦的抖音,都驗(yàn)證了同一個(gè)事實(shí):依托以算法為代表的前沿技術(shù), 數(shù)據(jù)可以挖掘出巨大的商業(yè)價(jià)值與潛力。與此同時(shí),如今互聯(lián)網(wǎng)行業(yè)已經(jīng)進(jìn)入了“產(chǎn)業(yè)互聯(lián)網(wǎng)”的下半場(chǎng),各個(gè)領(lǐng)域都在進(jìn)行數(shù)字化的轉(zhuǎn)型和升級(jí),而數(shù)據(jù)分析能力的強(qiáng)弱則決定了產(chǎn)業(yè)互聯(lián)網(wǎng)數(shù)字化水平的高低。因此,希望通過本書的內(nèi)容,給相關(guān)行業(yè)的從業(yè)者提供一些數(shù)據(jù)分析的思維和執(zhí)行方法,從而幫助更多的人在行業(yè)轉(zhuǎn)型的大背景下獲得先機(jī)。
我從2017 年進(jìn)入國(guó)內(nèi)的跨境電子商務(wù)行業(yè)發(fā)展,如今在幫助服飾行業(yè)的中小企業(yè)做數(shù)字化轉(zhuǎn)型,這五年間經(jīng)歷了跨境電商的熱潮,也看到了“產(chǎn)業(yè)數(shù)字化”帶來的機(jī)會(huì), 但更多時(shí)候我面對(duì)的則是,眾多企業(yè)經(jīng)營(yíng)者在處理茫茫數(shù)據(jù)中的不知所措和無奈。例如, 許多跨境電商創(chuàng)業(yè)者在面對(duì)海外數(shù)據(jù)時(shí),不知道如何搭建用戶畫像體系來提升運(yùn)營(yíng)效率, 而國(guó)內(nèi)中小門店經(jīng)營(yíng)者想要做數(shù)字化轉(zhuǎn)型時(shí),面對(duì)“將現(xiàn)有線下顧客資源轉(zhuǎn)換成線上數(shù)據(jù)資產(chǎn)”的問題時(shí)也是一頭霧水。針對(duì)這些問題,我認(rèn)為,僅僅只是從技術(shù)角度進(jìn)行指導(dǎo)是不夠的,還需要結(jié)合具體的場(chǎng)景,梳理出其背后的業(yè)務(wù)邏輯,再針對(duì)有價(jià)值的環(huán)節(jié)進(jìn)行分析?;谏鲜雠袛?,我作為業(yè)務(wù)內(nèi)容編寫與技術(shù)專家周景陽(貪心科技聯(lián)合創(chuàng)始人兼副總裁)一同創(chuàng)作了本書,旨在連接業(yè)務(wù)與技術(shù),從而更高效地解決數(shù)據(jù)分析從業(yè)者遇到的問題。