坤流分析
一、引言
????????眾所周知,坤流由眾多梗組合,包括“雞你太美”、“真的是你呀”、“你干嘛呀”等,但不論什么梗流都會(huì)存在興盛和衰落。本文主要目的在于探討坤流的形成與演變,包括趨勢(shì)分析和因素分析兩部分,以助于其它梗的演變分析。由于B站數(shù)據(jù)難以獲取,故使用百度指數(shù)中的“雞你太美”、“蔡徐坤”和“只因你太美”的日均搜素指數(shù)。
二、趨勢(shì)分析
(一)數(shù)據(jù)處理
?????????搜索指數(shù)的時(shí)間為2019年3月至2023年7月,使用TOPSIS方法進(jìn)行綜合評(píng)價(jià),“雞你太美”、“蔡徐坤”和“只因你太美”各自的比重為38.84%、14.99%和46.17%。
(二)基礎(chǔ)分析


????????不論是原始數(shù)據(jù)還是綜合評(píng)價(jià),都可以發(fā)現(xiàn)2019年3月至2019年12月,坤流經(jīng)歷了興起、鼎盛和衰落三個(gè)階段。鼎盛時(shí)期即4月份,“雞你太美”搜索指數(shù)達(dá)到日均23073次,“蔡徐坤”搜索指數(shù)達(dá)日均115827次,“只因你太美”則達(dá)2358次,綜合評(píng)價(jià)為0.536,而衰落時(shí)最低評(píng)價(jià)為0.075,熱門詞“蔡徐坤”搜索指數(shù)也僅19614次。將這一階段稱為“坤流盛世”,當(dāng)然此時(shí)的作品受限于素材而相對(duì)單一,例如“當(dāng)蔡徐坤穿越到《我的世界》生存”@GoldenEggs 。
????????2020年1月至2020年11月,搜索指數(shù)有所回升,存在兩個(gè)峰值期,即3月和8月,綜合評(píng)價(jià)分別為0.163和0.136,這三者在3月的搜索指數(shù)分別為2805、57908和1023,在8月的搜索指數(shù)分別為1692、51189和625。將這一階段稱為“坤流之治”,此期間的作品如“【蔡徐坤】仙劍雞俠傳”@金色傳說竹鼠 。
????????2020年12月至2022年5月,這一段時(shí)間搜索指數(shù)非常低,“蔡徐坤”一詞的最高搜素指數(shù)為27848次,最低則為2333次,綜合評(píng)價(jià)也相應(yīng)為0.072和0.011。將這一階段稱為“坤流低谷”,這一時(shí)期優(yōu)秀作品相對(duì)較少,但也有如“雞湯你太美”@愛吃波肉的肥羊 相對(duì)較好的作品。
????????2022年6月至今,受各種原因,搜索指數(shù)驟增,三者目前最高搜索指數(shù)分別為13147、135952和22981,綜合評(píng)價(jià)為0.567,目前最高。這一時(shí)期也存在一定跌落,即今年5月份綜合評(píng)價(jià)降為0.23,“蔡徐坤”搜索指數(shù)降為16601次,但值得注意的是“只因你太美”在今年1月份達(dá)到整個(gè)時(shí)期最高,這與其余兩個(gè)有較大差異。將這一階段稱為“坤流中興”,這一時(shí)期優(yōu)秀作品眾多,如“雞你太美官方MV”@哦呼w 。
????????總之,“坤流”目前經(jīng)歷了“坤流盛世(2019.3-2019.12)”、“坤流之治(2020.1-2020.11)”、“坤流低谷(2020.12-2022.5)”和“坤流中興(2022.6-)”?!袄ち鳌崩碚撋仙显?021年后就基本不會(huì)單獨(dú)產(chǎn)生優(yōu)秀作品,社會(huì)因素或強(qiáng)力宣傳起了重大作用。
(三)時(shí)間序列分析


????????“坤流”作品的產(chǎn)生是否具有季節(jié)性呢?據(jù)圖3和圖4明顯發(fā)現(xiàn)具有季節(jié)性,1、2、7和8月增長(zhǎng)較快(分解圖從2019年1月開始–第三幅,月度圖可看橫線),這主要受寒暑假影響,這也說明學(xué)生群體的重要影響(提醒適度玩梗)。
????????在R語言中使用auto.arima()實(shí)現(xiàn)最優(yōu)ARIMA模型的選取,ARIMA(0,2,2)即2階差分后平穩(wěn),2階后自相關(guān)減少到零,偏自相關(guān)逐漸減少到零。模型的均方根誤差為0.099,ACF1值為0.028,而使用指數(shù)平滑的均方根誤差為0.1,ARIMA較指數(shù)平滑稍好。ARIMA模型的殘差沒有通過顯著性檢驗(yàn),可接受殘差的自相關(guān)系數(shù)為0。


????????使用forecast函數(shù)預(yù)測(cè)今年8月、9月和10月,從相對(duì)值看,呈增長(zhǎng)趨勢(shì)并大于7月0.4的綜合評(píng)價(jià)。當(dāng)然這只說明坤流的流行程度可能上升。
三、因素分析
(一)傳播模型
????????社會(huì)網(wǎng)絡(luò)中不僅有疾病的傳播,還有時(shí)尚、觀點(diǎn)和流言等信息的傳播。經(jīng)濟(jì)網(wǎng)絡(luò)中的危機(jī)擴(kuò)散。在線社會(huì)網(wǎng)絡(luò)上的信息傳播行為既有一些共性的特征,也呈現(xiàn)出各自不同的特點(diǎn)。例如,由于微博極強(qiáng)的實(shí)時(shí)性特征,使得微博上信息的傳播速度異常之快。在經(jīng)典傳染病模型中,N個(gè)個(gè)體的狀態(tài)有易感染狀態(tài)S、感染個(gè)體I和移除狀態(tài)R,記s(t)為t時(shí)刻易感染的比例,i(t)則為感染病例,被傳染的概率為β。SIS模型中,每一個(gè)感染個(gè)體以定常速率γ再變?yōu)橐赘腥緜€(gè)體,對(duì)于大規(guī)模網(wǎng)絡(luò),設(shè)初始時(shí)刻感染個(gè)體比例為i(0),有公式:

????????當(dāng)λ=β/γ>1時(shí),對(duì)應(yīng)Logistic增長(zhǎng)曲線。例如我們?cè)O(shè)定i(0)=0.0001,β=0.7,γ=0.3,t從0到50,大約t=27時(shí),比例就達(dá)到一半,17和28近似拐點(diǎn)(第一期)。理論上,在第一期某個(gè)時(shí)刻發(fā)生突變進(jìn)入第二期,將感染比例迅速提升,再突變進(jìn)入第三期,感染比例再迅速提升。比如在第一期t=17時(shí)進(jìn)入第二期,感染比例由0.078增長(zhǎng)至0.22,在t=21時(shí)進(jìn)入第三期,感染比例由0.432增長(zhǎng)至0.471。這里我們猜測(cè)“坤流之治”和“坤流中興”都可能是由于某種突變因素導(dǎo)致,受限知識(shí)范圍和能力,具體細(xì)節(jié)暫無法詳細(xì)分析。

(二)因素分析
????????由于影響因素眾多,本文著重分析流量當(dāng)期值與“坤流”綜合評(píng)價(jià)的關(guān)系。從流量當(dāng)期值趨勢(shì)圖可以看出總體呈現(xiàn)上升趨勢(shì),但幾乎每年12月都有小幅下降。

????????從相關(guān)系數(shù)來看,“坤流”和流量當(dāng)期值線性關(guān)系很弱,僅0.143。在滯后階數(shù)為2時(shí),進(jìn)行格蘭杰因果檢驗(yàn):基于變量綜合評(píng)價(jià)與流量,顯著性P值為0.794,不呈現(xiàn)顯著性,不能拒絕原假設(shè),綜合評(píng)價(jià)不可以引起流量變化。 基于變量流量與綜合評(píng)價(jià),顯著性P值為0.023**,呈現(xiàn)顯著性,拒絕原假設(shè),流量可以引起綜合評(píng)價(jià)變化。
????????本文基于“坤流”發(fā)展劃分了四個(gè)時(shí)期,進(jìn)行簡(jiǎn)單預(yù)測(cè),概述了傳播模型,并簡(jiǎn)略分析了流量和“坤流”的關(guān)系。而實(shí)際上,有著眾多因素影響著“坤流”,比如股價(jià),傳播模型也應(yīng)當(dāng)更加復(fù)雜,受限于知識(shí)水平,分析相對(duì)粗略,望更多人士能夠進(jìn)行分析。