手機(jī)站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 科技 »學(xué)習(xí) » 【爬蟲案例】用Python爬大麥網(wǎng)任意城市的近期演出！

【爬蟲案例】用Python爬大麥網(wǎng)任意城市的近期演出！

2023-06-25 06:50 作者:馬哥python說 0人讀過 | 我要投稿

一、爬取目標(biāo)

大家好，我是@馬哥python說，一枚10年程序猿。

今天分享一期python爬蟲案例，爬取目標(biāo)是大麥網(wǎng)近期演出活動：

https://search.damai.cn/search.html?keyword=

二、展示爬取結(jié)果

爬取結(jié)果截圖：

含10個字段：

頁碼，演出標(biāo)題，鏈接地址，演出時間，演出城市，演出地點，售價，演出類別，演出子類別，售票狀態(tài)。

演示視頻：

以上。

三、講解代碼

首先，導(dǎo)入需要用到的庫：

定義一個請求頭：

其中，cookie的獲取方式如下：

定義請求地址url：

定義請求參數(shù)params，從PayLoad中獲?。?/p>

發(fā)送請求，并且用json格式解析數(shù)據(jù)：

以"演出標(biāo)題"字段為例：

其他字段同理，不再贅述。?

最后是保存到csv文件：

其中，encoding參數(shù)設(shè)置為utf_8_sig，目的是防止csv文件產(chǎn)生亂碼，不便讀取。

整個代碼中，還含有：設(shè)置sleep隨機(jī)等待、判斷循環(huán)停止條件、防止多次寫入表頭、用戶input輸入過濾條件、往csv文件名添加時間戳等功能，篇幅有限，詳細(xì)請見原始代碼。

四、同步視頻

代碼演示：

五、獲取完整源碼

愛學(xué)習(xí)的小伙伴，本次分析過程的完整python源碼及結(jié)果數(shù)據(jù)，我已打包好，并上傳至我的微信公眾號"老男孩的平凡之路"，后臺回復(fù)"爬大麥"即可獲取。

我是@馬哥python說，一名10年程序猿，近期持續(xù)分享python干貨中！

標(biāo)簽：網(wǎng)絡(luò)爬蟲 Python python爬蟲 Python教程 python爬蟲教程爬蟲教程 python代碼數(shù)據(jù)爬蟲