最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

價(jià)值上千元的Python爬蟲外包案例,學(xué)會(huì)你就賺了

2020-05-06 21:50 作者:松鼠愛吃餅干  | 我要投稿




前言

隨著互聯(lián)網(wǎng)時(shí)代的到來,人們更加傾向于互聯(lián)網(wǎng)購(gòu)物。某寶又是電商行業(yè)的巨頭,在某寶平臺(tái)中有很多商家數(shù)據(jù)。

今天帶大家使用python+selenium工具獲取這些公開的

適合人群:

Python零基礎(chǔ)、對(duì)爬蟲數(shù)據(jù)采集感興趣的同學(xué)!

環(huán)境介紹:

python 3.6
pycharm
selenium
time


1、安裝selenium模塊

pip install selenium


2、請(qǐng)求網(wǎng)頁(yè)地址

if __name__ == '__main__':
? ?keyword = input('請(qǐng)輸入你要查詢的商品數(shù)據(jù):')
? ?driver = webdriver.Chrome()
? ?driver.get('https://www.taobao.com')
? ?main()


def search_product(key):
? ?"""模擬搜索商品,獲取最大頁(yè)數(shù)"""
? ?driver.find_element_by_id('q').send_keys(key) ?# 根據(jù)id值找到搜索框輸入關(guān)鍵字
? ?driver.find_element_by_class_name('btn-search').click() ?# 點(diǎn)擊搜索案例
? ?driver.maximize_window() ?# 最大化窗口
? ?time.sleep(15)

page = driver.find_element_by_xpath('//*[@id="mainsrp-pager"]/div/div/div/div[1]') ?# 獲取頁(yè)數(shù)的標(biāo)簽
? ?page = page.text ?# 提取標(biāo)簽的文字
? ?page = re.findall('(\d+)', page)[0] ?
? ?# print(page)
? ?return int(page)




4、獲取商品數(shù)據(jù)

def get_product():
? ?divs = driver.find_elements_by_xpath('//div[@class="items"]/div[@class="item J_MouserOnverReq ?"]')
? ?for div in divs:
? ? ? ?info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text ?# 商品名稱
? ? ? ?price = div.find_element_by_xpath('.//strong').text + '元' ?# 商品價(jià)格
? ? ? ?deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text ?# 付款人數(shù)
? ? ? ?name = div.find_element_by_xpath('.//div[@class="shop"]/a').text ?# 店鋪名稱
? ? ? ?print(info, price, deal, name, sep='|')
? ? ? ?with open('data.csv', 'a', newline='') as csvfile: ?# newline='' ?指定一行一行寫入
? ? ? ? ? ?csvwriter = csv.writer(csvfile, delimiter=',') ?# delimiter=',' ?csv數(shù)據(jù)的分隔符
? ? ? ? ? ?csvwriter.writerow([info, price, deal, name]) ?# 序列化數(shù)據(jù),寫入csv
? ? ? ? ? ?
def main():
? ?search_product(keyword)
? ?page = get_product()



完整代碼如下:

from selenium import webdriver

import time

import re

import csv



def search_product(key):

? ? """模擬搜索商品,獲取最大頁(yè)數(shù)"""

? ? driver.find_element_by_id('q').send_keys(key)? # 根據(jù)id值找到搜索框輸入關(guān)鍵字

? ? driver.find_element_by_class_name('btn-search').click()? # 點(diǎn)擊搜索案例

? ? driver.maximize_window()? # 最大化窗口

? ? time.sleep(15)


? ? page = driver.find_element_by_xpath('//*[@id="mainsrp-pager"]/div/div/div/div[1]')? # 獲取頁(yè)數(shù)的標(biāo)簽

? ? page = page.text? # 提取標(biāo)簽的文字

? ? page = re.findall('(\d+)', page)[0]??

? ? # print(page)

? ? return int(page)



def get_product():

? ? divs = driver.find_elements_by_xpath('//div[@class="items"]/div[@class="item J_MouserOnverReq? "]')

? ? for div in divs:

? ? ? ? info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text? # 商品名稱

? ? ? ? price = div.find_element_by_xpath('.//strong').text + '元'? # 商品價(jià)格

? ? ? ? deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text? # 付款人數(shù)

? ? ? ? name = div.find_element_by_xpath('.//div[@class="shop"]/a').text? # 店鋪名稱

? ? ? ? print(info, price, deal, name, sep='|')

? ? ? ? with open('data.csv', 'a', newline='') as csvfile:? # newline=''? 指定一行一行寫入

? ? ? ? ? ? csvwriter = csv.writer(csvfile, delimiter=',')? # delimiter=','? csv數(shù)據(jù)的分隔符

? ? ? ? ? ? csvwriter.writerow([info, price, deal, name])? # 序列化數(shù)據(jù),寫入csv



def main():

? ? search_product(keyword)

? ? page = get_product()



if __name__ == '__main__':

? ? keyword = input('請(qǐng)輸入你要查詢的商品數(shù)據(jù):')

? ? driver = webdriver.Chrome()

? ? driver.get('https://www.taobao.com')

? ? main()

喜歡的就請(qǐng)關(guān)注加點(diǎn)贊

價(jià)值上千元的Python爬蟲外包案例,學(xué)會(huì)你就賺了的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
沐川县| 萝北县| 鲁山县| 灌云县| 宁乡县| 永春县| 乐安县| 那曲县| 福泉市| 来宾市| 德令哈市| 富宁县| 类乌齐县| 甘孜县| 新乡市| 黑水县| 福鼎市| 绥滨县| 蕉岭县| 乐至县| 宜章县| 镇安县| 化州市| 赤水市| 东山县| 怀柔区| 双峰县| 松潘县| 射阳县| 旬邑县| 临海市| 江达县| 广德县| 苏尼特左旗| 韶山市| 东海县| 崇明县| 北流市| 清流县| 和龙市| 雅江县|