B站新16位id規(guī)律的極粗略觀察
前不久,突然發(fā)現(xiàn)空間鏈接出現(xiàn)了十六位uid:

聯(lián)想到彈幕反查的本質就是窮舉,而對于十六位id,進行窮舉代價極大:

如圖,原本只需要幾分鐘不到的過程現(xiàn)在如此痛苦,因此試圖找到新版id分配的規(guī)律,以減少猜測范圍(盡管最新散列算法是什么仍未可知,但找到uid分布規(guī)律仍是有意義的)

通過獲取用戶關注列表的方式,可以對其關注列表中前250位的用戶的uid進行統(tǒng)計,經(jīng)過篩選即可整理出16位uid,在足夠多樣本下,可粗略觀察到uid的分布規(guī)律.

爬取結果:去重后共爬取到55508個uid,排序后進行觀察
觀察結果:
標()的為不確定的位,可能會因樣本數(shù)量不足而存在誤差
號段均為閉區(qū)間:
346156-345158
349297(2)
349307(4)-349309(5)
349310(3)-349314(6)
349325(5)-349329(9)
349434(9)-349434(9)
349435(0)-349438(1)
353699(3)-353699(7)
353710(4)-353712(5)
354636(6)
354637(2)-354637(4)
本來應該有個分布相關的統(tǒng)計圖,神志模糊了畫不出來,鴿了

結論:b站新16位uid分布呈一定規(guī)律性,通常其分布以六位數(shù)號段為單位集中
根據(jù)本次爬取的結果,可將暴力猜測的組合限定為多個固定的十位區(qū)間,大幅降低了窮舉成本.
附件:
爬取結果 https://github.com/Werewolf-Wu/Bilibili_uid_spider_werwu/blob/main/result.txt
標簽: