最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

2021年最新Python爬蟲教程+實(shí)戰(zhàn)項(xiàng)目案例(新增scarpy部分+分布式爬

2023-03-13 19:51 作者:qjqjj  | 我要投稿

p31 去除爬取子頁面的代碼直接爬取圖片。 精簡(jiǎn)了代碼,減少了requests的請(qǐng)求。

import requests
from bs4 import BeautifulSoup
import os

os.mkdir(r"D:\\python_homework\\src\\爬取內(nèi)容\\")

url = 'https://www.umei.cc/weimeitupian/xiaoqingxintupian/'
url_2 = 'https://www.umei.cc'

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 SLBrowser/8.0.0.9071 SLBChan/105'
}

response = requests.get(url)
response.encoding = 'utf-8'
mian_page = BeautifulSoup(response.text, "html.parser")
imglist = mian_page.find("div", class_='item_list infinite_scroll').find_all("img", class_="lazy")

for i in imglist:
    img = requests.get(i.get("data-original"), headers=headers).content
    name = i.get("data-original").split("/")[-1]
    with open('D:\\python_homework\\src\\爬取內(nèi)容\\plcture\\{}'.format(name), 'wb')as fp:
        fp.write(img)
        print(name + "下載完成!")
fp.close()


2021年最新Python爬蟲教程+實(shí)戰(zhàn)項(xiàng)目案例(新增scarpy部分+分布式爬的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
永年县| 禹城市| 西华县| 长沙县| 霍城县| 清水河县| 十堰市| 囊谦县| 页游| 阳高县| 南平市| 噶尔县| 伊金霍洛旗| 天柱县| 马公市| 浑源县| 奉新县| 巴中市| 开远市| 镇坪县| 昌都县| 南郑县| 岐山县| 建水县| 湾仔区| 彰化县| 房山区| 北川| 尼勒克县| 米泉市| 武定县| 德阳市| 长寿区| 湘潭市| 阜南县| 铁岭市| 福海县| 龙泉市| 天气| 岳池县| 龙海市|