「科普向」我關(guān)注的主播/Up數(shù)據(jù)到底是真是假?關(guān)于前臺數(shù)據(jù)那點事
首先,我不確定這篇文章是否能發(fā)出來 發(fā)不出來會截圖 如果你是在群里看到 那就是發(fā)不出來 ?

許久沒更新干貨,道個歉。工作原因,需要離開一陣子 快結(jié)束了。?因為現(xiàn)在老板不是很懂技術(shù),又要求保密。 所以最多也就能寫這樣的科普文了,其余的都在保密范疇。

切入正題吧,我們前臺看到的數(shù)據(jù)是真是假?
不限平臺,不限內(nèi)容形式得看,絕大多數(shù)是假的。
不過B站的視頻播放數(shù)據(jù),抖音的點贊評論和自己看到的觀看數(shù)據(jù)是真的。
假數(shù)據(jù)區(qū)分:平臺給的?+ 內(nèi)容創(chuàng)作者自己刷的
個人認(rèn)為, 這兩種情況必須區(qū)分來講。

平臺給的
1.挽尊算法
這是很久以前的一個公司起的名字,為了新Up繼續(xù)學(xué)習(xí)和創(chuàng)作,前期會定時給視頻一些觀看數(shù)據(jù)少的可憐的加點觀看量。實際觀看量高了就不給了。
相對公平,對于真正熱門的內(nèi)容也沒什么影響。更重要的是,可以留住一些新人創(chuàng)作者,使得他們不至于流失。至于多少是真的 前期可以看自己發(fā)布的東西觀看量增長是否比大部分埋沒的視頻快來大致判斷。觀察了下B站點播視頻的機制。沒有挽尊。
2.直播人氣加成
人氣不等于人數(shù)。算出來的一個值 大約是人數(shù)的5-10倍,各平臺不一樣。官方直播間和主播直播間也不一樣。
一般單一值很難確定這個用戶是否在線。所以本身人氣值就是很多數(shù)據(jù)混合而成。比如彈幕長鏈接連接數(shù)。視頻CDN鏈接數(shù)。單位時間打賞人數(shù)。單位時間彈幕發(fā)送人數(shù)。播放器打點人數(shù)。都有相應(yīng)系數(shù)。這些東西有一兩樣異常的時候平臺也很容易追查出盜流或是主播自己刷人氣的情況(沒有安全的,想查都能查)
原因嘛,算是行規(guī)?都加,誰家不加血虧。主播也不愛播。目前以帶貨為生的平臺一班是無加成的。
3. 跟平臺買量
大體量有推薦算法的平臺一般直接推給真實用戶了。真實觀看。有些就后臺幫你改庫。

內(nèi)容創(chuàng)作者自己刷
這個話題可就有意思了 先看看原理
直播:第三方用邊緣節(jié)點服務(wù)器 甚至是終端機直接刷那幾個數(shù)據(jù)。
點播:兩種方式 第一種和直播一樣。第二種,刷互動量,發(fā)些無用的廢話,使得推薦幾率增高。賺取真實觀看量。
內(nèi)容平臺(微博小說網(wǎng)站等):發(fā)無用廢話。
平臺反作弊方式
必須明確的是,只要數(shù)據(jù)留存夠全,都能分析出來哪些是刷的量。就比如我以前很喜歡看用戶流水日志。簡單幾行Python就能發(fā)現(xiàn)一大堆問題。刷量沒被發(fā)現(xiàn),就是平臺懶得理你,不要抱有僥幸
常規(guī)反作弊手段:
1.?IP 設(shè)備號 請求頭分析:不多贅述都能理解,所以刷量需要大量設(shè)備和不同網(wǎng)絡(luò)環(huán)境。
2. 請求匹配分析:參考直播。幾項數(shù)據(jù),如果不合理,比如彈幕長連接和視頻鏈接數(shù)差很多。
3. 時間維度分析:舉個例子,正常直播,一般再過幾分鐘之后才有推送,觀眾也不會突然一波上線。如果一開播猛增播放量,肯定是刷的無疑?;蛘弑热缬^看請求時間間隔都差不多,那也是刷的。畢竟正常人類看東西不會給自己裝個計時器還是一大幫人一起裝。
4. 推薦機制直接防止。比如抖音。視頻推薦給喜歡這類視頻或者作者的用戶 同時,視頻曝光度取決于單條視頻的完播點贊。創(chuàng)作者劃分也很細(xì)。單條視頻買量根本不管。但是,賬號的受眾群體就很容易花了。下一次推不到正確的用戶,幾項數(shù)據(jù)慘淡。多買幾次,賬號就廢了。只能老老實實買官方的,至少知道推得是垂類用戶。
5 根本不管:吃的就這口飯,流量就是錢。甭管真的假的,有流量就有錢賺。管你是不是刷量。機器發(fā)的廢話也是用戶活躍度,不要白不要。

差不多說完了 有遺漏的也就這樣吧 不是干貨,就不放群號了。祝數(shù)據(jù)民工安好~早日把賬號做起來。