數(shù)據(jù)分析實(shí)戰(zhàn)案例解讀:【李子柒辣椒醬】的口碑到底怎么樣?
來? 源:數(shù)據(jù)不吹牛/作? 者:小z

本文從一個(gè)具體的評價(jià)分析場景切入,按步分析,力求還原分析的每個(gè)環(huán)節(jié)。
最近收到不少留言,問最多的是:“我是偏運(yùn)營/業(yè)務(wù)分析的,復(fù)雜的分析算法我不會(huì),還有什么方法能夠?qū)υu價(jià)類數(shù)據(jù)做更深入分析嗎?”
剛開始我會(huì)昧著良心回復(fù)“詞云??!”
然鵝總是會(huì)被DISS“詞云太簡單了吧,有點(diǎn)low!”

我猙獰一笑,雖然這個(gè)問題有點(diǎn)像“我長的不帥也沒錢,有沒有什么辦法能夠追到白富美”。但從數(shù)據(jù)分析的角度來看,仍不失為一個(gè)好問題。
好在哪里呢?在回答之前,先瞧一個(gè)數(shù)據(jù)分析常見思維誤區(qū)。
一些同學(xué)總是認(rèn)為,分析不出來有價(jià)值的結(jié)果,是因?yàn)橛袃芍粩r路虎,一是數(shù)據(jù)量和維度不夠,二是因?yàn)樽约翰粫?huì)復(fù)雜的分析模型和算法。然后,也沒有再去思考,如何基于現(xiàn)狀更進(jìn)一步地分析問題。

數(shù)據(jù)維度和算法的價(jià)值當(dāng)然不言而喻,但總是把分析不出結(jié)果和價(jià)值的鍋甩出去,這種歸錯(cuò)于外的思維非常危險(xiǎn),它營造了一種“分析不出結(jié)果,我也沒辦法”的心安理得。
而“我不會(huì)高階分析工具和方法,但基于現(xiàn)狀,去思考或者詢問有沒有更好的分析方式”,雖然這種思維也有槽點(diǎn),但本身算是一種在現(xiàn)階段嘗試去解決問題的思路。
So,我們循著后一種思路,以李子柒在天貓上賣的一款辣椒醬評價(jià)為例:

看看基于現(xiàn)有的“單薄”數(shù)據(jù)維度,怎樣讓分析再向前邁進(jìn)一步。

魯迅曾經(jīng)沒說過:“明確分析目標(biāo),你的分析已經(jīng)成功了一大半”。

做深入分析之前,面對這一堆評價(jià)數(shù)據(jù),我們要明確,究竟想通過分析來解決什么問題?只有明確分析目標(biāo),才能把發(fā)散的思維聚焦起來。
為了給大家一個(gè)明確的分析錨點(diǎn),假設(shè)我們是這款辣椒醬的產(chǎn)品負(fù)責(zé)人,要基于評價(jià),更好的獲悉消費(fèi)者對產(chǎn)品的看法,從而為后續(xù)產(chǎn)品優(yōu)化提供思路。
所以,我們的分析目標(biāo)是“基于評價(jià)反饋,量化消費(fèi)者感知,指導(dǎo)優(yōu)化產(chǎn)品”。
注:這里給到的一個(gè)假設(shè)目標(biāo)并不完美,主要是拋磚引玉,大家可以從不同的維度來提出目標(biāo)假設(shè),嘗試不同分析方向。
是不是有那么一丟丟分析思路了?別急,目標(biāo)還需要繼續(xù)拆解。

這些年來,最有價(jià)值的一個(gè)字,便是“拆”了。
在數(shù)據(jù)分析中也是同理。
我們在上一步已經(jīng)確定了“基于評價(jià)優(yōu)化產(chǎn)品”的目標(biāo),但這只是一個(gè)籠統(tǒng)模糊的目標(biāo)。要讓目標(biāo)真正可落地,“拆”是必不可少的一步。
“拆”的藝術(shù)大體可以分為兩步,第一步是換位思考。
評價(jià)來源于客戶,客戶對產(chǎn)品有哪些方面的感知呢?我們可以閉上眼睛,幻想自己購買了這款辣椒醬。
接著進(jìn)入第二步,基于換位的邏輯拆解,這里可以按照模擬購物流程的邏輯來拆解:
首先,李子柒本身有非常強(qiáng)的IP光環(huán),大家在選購時(shí)或多或少是慕名而來。所以,在購買決策時(shí),到底有多大比例是沖著李子柒來的?
Next,在沒收到貨前,影響體驗(yàn)的肯定是物流,付款到收貨用了幾天?派送員態(tài)度怎么樣,送貨上門了嗎?
收到貨后,使用之前,體感最強(qiáng)的則是包裝。外包裝有沒有破損?有沒有變形?產(chǎn)品包裝是精致還是粗糙?
接下來是產(chǎn)品體驗(yàn),拿辣椒醬來說,日期是否新鮮?牛肉用戶是否喜歡?到底好不好吃?
吃完之后,我們建立起了對產(chǎn)品的立體感知——性價(jià)比。我花錢買這個(gè)產(chǎn)品到底值不值?這個(gè)價(jià)位是貴了還是便宜?實(shí)惠不實(shí)惠?
品牌、物流、包裝、產(chǎn)品(日期、口味)和性價(jià)比五大天王鋒芒初現(xiàn),我們下一步需要量化消費(fèi)者對于每個(gè)方面的感知。

對于評價(jià)的拆解和量化,這里介紹一種簡單粗暴的方式,按標(biāo)點(diǎn)把整條評論拆分成零散的模塊,再設(shè)置一系列預(yù)置詞來遍歷。
注:再次強(qiáng)調(diào)我們這篇內(nèi)容的主題是“如何基于最基礎(chǔ)的技術(shù),做進(jìn)一步的分析,這里假設(shè)我們只會(huì)最基礎(chǔ)的python語法和pandas。
有同學(xué)會(huì)問“為什么不用分詞”!此問可謂正中我懷。不過,我把這個(gè)問題當(dāng)作開放式思考題留給大家——如果用分詞,如何實(shí)現(xiàn)同樣的效果,以及有什么優(yōu)缺點(diǎn)?
言歸正傳,我們先看看實(shí)戰(zhàn)爬取的評論數(shù)據(jù),一共1794條:

把每條評論按照標(biāo)點(diǎn)拆分成短句,為了省事,用了簡單的正則拆分:

我們發(fā)現(xiàn),就算是比較長段的評論,也只是涉及到品牌、物流、包裝、產(chǎn)品和性價(jià)比的部分方面,所以,我們依次去遍歷匹配,看短句中有沒有相關(guān)的內(nèi)容,沒有就跳過,有的話再判斷具體情緒。
以物流為例,當(dāng)短句中出現(xiàn)“物流”、“快遞”、“配送”、“取貨”等關(guān)鍵詞,大體可以判定這個(gè)短句和物流相關(guān)。
接著,再在短句中尋找代表情緒的詞匯,正面的像“快”、“不錯(cuò)”、“棒”、“滿意”、“迅速”;負(fù)面的“慢”、“龜速”、“暴力”、“差”等。
在我們預(yù)設(shè)詞的基礎(chǔ)上進(jìn)行兩次遍歷匹配,大體可以判斷這句話是不是和物流相關(guān),以及客戶對物流的看法是正面還是負(fù)面:

為方便理解,用了灰常丑陋的語法來一對一實(shí)現(xiàn)判斷。包裝、產(chǎn)品和性價(jià)比等其他模塊的判斷,也是沿用上述邏輯,只是在預(yù)設(shè)詞上有所差異,部分代碼如下:
1 def judge_comment(df,result):
? ?judges = pd.DataFrame(np.zeros(13 * len(df)).reshape(len(df),13),
? ? ? ? ? ? ? ? ? ? ?columns = ['品牌','物流正面','物流負(fù)面','包裝正面','包裝負(fù)面','原料正面',
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? '原料負(fù)面','口感正面','口感負(fù)面','日期正面','日期負(fù)面',
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? '性價(jià)比正面','性價(jià)比負(fù)面'])
? ?for i in range(len(result)):
? ? ? ?words = result[i]
? ? ? ?for word in words:
?
?#李子柒的產(chǎn)品具有強(qiáng)IP屬性,基本都是正面評價(jià),這里不統(tǒng)計(jì)情緒,只統(tǒng)計(jì)提及次數(shù)
if '李子柒' in word or '子柒' in word or '小柒' in word or '李子七' in word\
? ? ? ? ? ? ? ?or '小七' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['品牌'] = 1
? ?#先判斷是不是物流相關(guān)的
? ?
? ? ?
if '物流' in word or '快遞' in word or '配送' in word or '取貨' in word:
?
? ?#再判斷是正面還是負(fù)面情感
? ? ? ? ? ? ? ?
if '好' in word or '不錯(cuò)' in word or '棒' in word or '滿意' in word or '迅速' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['物流正面'] = 1
? ? ? ? ? ? ? ?elif '慢' in word or '龜速' in word or '暴力' in word or '差' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['物流負(fù)面'] = 1
? ?
#判斷是否包裝相關(guān)
?
? ? ? ? ?
if '包裝' in word or '盒子' in word or '袋子' in word or '外觀' in word:
? ? ? ? ? ? ? ?if '高端' in word or '大氣' in word or '還行' in word or '完整' in word or '好' in word or\
? ? ? ? ? ? ? ? ? '嚴(yán)實(shí)' in word or '緊' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['包裝正面'] = 1
? ? ? ? ? ? ? ?elif ?'破' in word or '破損' in word or '癟' in word or '簡陋' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['包裝負(fù)面'] = 1
? ?
#產(chǎn)品
? ? ? ? ? ?
? ?
#產(chǎn)品原料是牛肉為主,且評價(jià)大多會(huì)提到牛肉,因此我們把這個(gè)單獨(dú)拎出來分析
?
if '肉' in word:
? ? ? ? ? ? ? ?if '大' in word or '多' in word or '足' in word or '香' in word or '才' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['原料正面'] = 1
? ? ? ? ? ? ? ?elif '小' in word or '少' in word or '沒' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['原料負(fù)面'] = 1
? ? ?#口感的情緒
? ? ? ? ??
?if '口味' in word or '味道' in word or '口感' in word or '吃起來' in word:
? ? ? ? ? ? ? ?if '不錯(cuò)' in word or '好' in word or '棒' in word or '鮮' in word or\
? ? ? ? ? ? ? ? ? ?'可以' in word or '喜歡' in word or '符合' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['口感正面'] = 1
? ? ? ? ? ? ? ?elif '不好' in word or '不行' in word or '不鮮' in word or\
? ? ? ? ? ? ? ? ? ?'太爛' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['口感負(fù)面'] = 1
? ? ?#口感方面,有些是不需要出現(xiàn)前置詞,消費(fèi)者直接評價(jià)好吃難吃的,例如:
? ? ? ?if '難吃' in word or '不好吃' in word:
? ? ? ? ? ? ? ?judges.iloc[i]['口感負(fù)面'] = 1
? ? ? ? ? ?elif '好吃' in word or '香' in word:
? ? ? ? ? ? ? ?judges.iloc[i]['口感正面'] = 1
? ? #日期是不是新鮮
?
? ? ? ? ?
if '日期' in word or '時(shí)間' in word or '保質(zhì)期' in word:
? ? ? ? ? ? ? ?if '新鮮' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['日期正面'] = 1
? ? ? ? ? ? ? ?elif '久' in word or '長' in word:
? ? ? ? ? ? ? ? ? ?judges.iloc[i]['日期負(fù)面'] = 1
? ? ? ? ? ?elif '過期' in word:
? ? ? ? ? ? ? ?judges.iloc[i]['日期負(fù)面'] = 1
? ? ?#性價(jià)比
? ? ? ? ? ?
if '劃算' in word or '便宜' in word or '賺了' in word or '囤貨' in word or '超值' in word or \
? ? ? ? ? ? ? ?'太值' in word or '物美價(jià)廉' in word or '實(shí)惠' in word or '性價(jià)比高' in word or '不貴' in word:
? ? ? ? ? ? ? ?judges.iloc[i]['性價(jià)比正面'] = 1
? ? ? ? ? ?elif ?'貴' in word or '不值' in word or '虧了' in word or '不劃算' in word or '不便宜' in word:
? ? ? ? ? ? ? ?judges.iloc[i]['性價(jià)比負(fù)面'] = 1
? ?
final_result = pd.concat([df,judges],axis = 1)
??
return final_result
運(yùn)行一下,結(jié)果畢現(xiàn):

第一條評價(jià),很明顯的說快遞暴力,對應(yīng)“物流負(fù)面”計(jì)了一分。
第二條評價(jià),全面夸贊,提到了品牌,和正面的物流、口感信息。
第三條評價(jià),粉絲表白,先說品牌,再夸口感。
看起來還不賴,下面我們對結(jié)果數(shù)據(jù)展開分析。

我們先對結(jié)果做個(gè)匯總:

一共爬了1794條評論,評論中有提及到我們關(guān)注點(diǎn)的有1937次(之所以用次,是因?yàn)橐粭l評論中可能涉及到多個(gè)方面)。粗略一瞥,口感和原料占比較高,畫個(gè)圖更細(xì)致的看看。

看來,辣椒醬的口感(好不好吃)是客戶最最最關(guān)注的點(diǎn),沒有之一,占比高達(dá)57.98%,領(lǐng)先其他類別N個(gè)身位。
慢隨其后的,是原料、品牌、性價(jià)比和包裝,而物流和日期則鮮有提及,消費(fèi)者貌似不太關(guān)注,或者說目前基本滿足要求。
那不同類別正負(fù)面評價(jià)占比是怎么樣的呢?

整體來看,主流評論以好評為主,其中口感、品牌(這個(gè)地方其實(shí)沒有細(xì)分)、包裝以正面評價(jià)占絕對主導(dǎo)。
原料和性價(jià)比,負(fù)面評價(jià)占比分別是14%和38%,而物流和日期由于本身占比太少,參考性不強(qiáng)。
作為一個(gè)分析師,我們從原料、性價(jià)比負(fù)面評價(jià)占比中看到了深挖的機(jī)會(huì)。

原料負(fù)面評價(jià)是單純的在吐槽原材料嗎?

初步篩選之后,發(fā)現(xiàn)事情并沒有那么簡單。
原料負(fù)面評價(jià)共出現(xiàn)了53次,但里面有24次給了口感正面的評價(jià),甚至還有8次原料正面評價(jià)!羅生門嗎?

這8次即正面又負(fù)面的原料評價(jià),其實(shí)是揭了我們在預(yù)置詞方面的不嚴(yán)謹(jǐn),前面判斷牛肉相關(guān)的短句,“小”就是負(fù)面,“大”就是正面,有些絕對。
而判斷準(zhǔn)確的原料差評中,雖然有一半說味道不錯(cuò),但還是不留情面的吐槽了牛肉粒之小,之少,甚至還有因此覺得被騙。
如何讓牛肉粒在體感上獲取更多的好評,是應(yīng)該在產(chǎn)品傳播層做期望控制的宣導(dǎo)?還是在產(chǎn)品層增加牛肉的“肉感”?需要結(jié)合具體業(yè)務(wù)進(jìn)一步探究。
性價(jià)比呢?
性價(jià)比相關(guān)負(fù)面評價(jià)共58次,負(fù)面情緒占性價(jià)比相關(guān)的38%。這些負(fù)面評價(jià)消費(fèi)者大多數(shù)認(rèn)為價(jià)格偏貴,不劃算,還有一部分提到了通過直播渠道購買價(jià)格相對便宜,但日常價(jià)格難以接受。
坦白講,這款辣醬的價(jià)格在線上確實(shí)屬于高端價(jià)位,而價(jià)格體系是一個(gè)比較復(fù)雜的場景,這里暫不展開分析。
但是對于這部分認(rèn)為性價(jià)比不符預(yù)期的客戶,是應(yīng)該因此反推產(chǎn)品價(jià)格,還是把他們打上“價(jià)格敏感的標(biāo)簽”,等大促活動(dòng)喚醒收割,這是兩條可以考慮并推進(jìn)的道路。
物流和日期提及太少,不具備參考性,但為了不那么虎頭蛇尾,我們還是順手看一眼物流負(fù)面評價(jià):

果然,物流是一項(xiàng)必備需求,基本滿足預(yù)期的話消費(fèi)者并不會(huì)主動(dòng)提及,沒達(dá)預(yù)期則大概率會(huì)雷霆震怒。而物流暴力、速度太慢是兩個(gè)永恒的槽點(diǎn)。
至此,我們基于看起來簡單的評價(jià)數(shù)據(jù),用簡單淺白的方式,做了細(xì)致的拆分,并通過拆分更進(jìn)一步的量化和分析,向深淵,哦不,向深入邁進(jìn)了那么一丟丟。
文中涉及到的代碼,主要是拋磚引玉,大家還可以結(jié)合實(shí)際,做更精細(xì)的梳理和判斷。在整個(gè)分析過程中,去思考如何更深入的分析,如何明確分析方向,如何通過換位思考和流程拆解,把大目標(biāo)拆成可以分析的小目標(biāo),并最終落地,則需要在實(shí)踐中反復(fù)磨練,與君共勉!
-?END -
愛數(shù)據(jù)福利大放送
掃描/識(shí)別下方二維碼后
回復(fù)【辣椒醬】即可領(lǐng)取
本文數(shù)據(jù)源+代碼
《數(shù)據(jù)分析業(yè)務(wù)學(xué)習(xí)資料包》
數(shù)據(jù)產(chǎn)品知識(shí)框架思維導(dǎo)圖+1
100+數(shù)據(jù)集+1
20個(gè)數(shù)據(jù)分析實(shí)戰(zhàn)案例+1
行業(yè)熱門研究報(bào)告精選合集+1




