Python爬蟲案例:采集Tripadvisor數(shù)據(jù),全球最大的旅游網站
前言
Tripadvisor是全球領先的旅游網站,主要提供來自全球旅行者的點評和建議,全面覆蓋全球的酒店、景點、餐廳、航空公司 ,以及旅行規(guī)劃和酒店、景點、餐廳預訂功能。
Tripadvisor及旗下網站在全球49個市場設有分站,月均獨立訪問量達4.15億。


第三方庫
requests >>> pip install requests
parsel >>> pip install parsel
開發(fā)環(huán)境
版 本: python 3.8
編輯器: pycharm 2021.2
開始代碼
請求數(shù)據(jù)
2. 獲取數(shù)據(jù)(網頁源代碼)
3. 解析數(shù)據(jù)(提取我們想要的數(shù)據(jù)內容 詳情頁鏈接)
4. 發(fā)送請求(訪問所有的詳情頁鏈接) 獲取數(shù)據(jù)
5. 解析數(shù)據(jù)
6.保存數(shù)據(jù)
得到數(shù)據(jù)


標簽: