聊天沒有表情包被嘲諷,用python爬取了十萬張表情包
事情要從幾天前說起,我有一個朋友,他在和他喜歡的小姐姐聊天時,聊天的氣氛一直非常尬,這時他就想發(fā)點表情包來緩和一下氣氛,但一看自己的表情包收藏都是這樣的。。。

。。。這發(fā)過去,基本就直接和小姐姐說拜拜了,然后他就向我求救問我有沒有表情包,表情包我是沒有,但網(wǎng)站有呀,來來,爬蟲整起。

分析頁面
今天爬取的網(wǎng)站是斗圖吧,有一說一表情包是真的多,看這驚人的頁數(shù)

接下來就該看看怎么拿到表情包圖片的url了,首先打開谷歌瀏覽器,然后點F12進(jìn)入爬蟲快樂模式

然后完成下圖的操作,先點擊1號箭頭,然后再選中一個表情包即可,紅色框中就是我們要爬取的對象,其中表情包的src就在里面

現(xiàn)在我們就搞清楚了怎么拿到表情包的url了,就開始寫代碼了
具體實現(xiàn)
解析頁面
獲取網(wǎng)頁內(nèi)容
這里就是獲取爬取網(wǎng)頁的信息
解析網(wǎng)頁內(nèi)容
到現(xiàn)在為止,已經(jīng)拿到了所有的圖片的鏈接和名字,那么就可以開始下載了
文件下載
多線程下載
因為文件實在有點多,所以最好采用多線程的方式下載,我這里只是給了一個樣例,大家按照這個邏輯寫一下就好
成果
總共是爬了十萬多張表情包,這次咱也是表情包大戶了

有了這些,咱聊天還怕斗表情包嗎、、
爬蟲就是這么牛,處在這個看什么都要會員的時代,你確定不學(xué)一學(xué)爬蟲嗎,視頻學(xué)習(xí)看這里——Python學(xué)習(xí)視頻鏈接:https://www.bilibili.com/video/BV1SY4y1u7RS/?vd_source=cac20a0ed95f8aa595bbf8c685f07c5f
如果需要更多的學(xué)習(xí)教程,可以關(guān)注我或者后臺滴滴我,更多資料等你白嫖

標(biāo)簽: