最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

2021年最新Python爬蟲教程+實戰(zhàn)項目案例(新增scarpy部分+分布式爬

2023-02-15 21:08 作者:qjqjj  | 我要投稿

p31 去除爬取子頁面的代碼直接爬取圖片。 精簡了代碼,減少了requests的請求。

import requests
from bs4 import BeautifulSoup
import os

os.mkdir(r"D:\\python_homework\\src\\爬取內(nèi)容\\")

url = 'https://www.umei.cc/weimeitupian/xiaoqingxintupian/'
url_2 = 'https://www.umei.cc'

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 SLBrowser/8.0.0.9071 SLBChan/105'
}

response = requests.get(url)
response.encoding = 'utf-8'
mian_page = BeautifulSoup(response.text, "html.parser")
imglist = mian_page.find("div", class_='item_list infinite_scroll').find_all("img", class_="lazy")

for i in imglist:
    img = requests.get(i.get("data-original"), headers=headers).content
    name = i.get("data-original").split("/")[-1]
    with open('D:\\python_homework\\src\\爬取內(nèi)容\\plcture\\{}'.format(name), 'wb')as fp:
        fp.write(img)
        print(name + "下載完成!")
fp.close()


2021年最新Python爬蟲教程+實戰(zhàn)項目案例(新增scarpy部分+分布式爬的評論 (共 條)

分享到微博請遵守國家法律
治多县| 河北省| 赣榆县| 明水县| 巴彦淖尔市| 曲松县| 璧山县| 麟游县| 尉氏县| 鞍山市| 新闻| SHOW| 通江县| 岑巩县| 中西区| 吴川市| 辰溪县| 阿拉善右旗| 新平| 博兴县| 扶沟县| 昌宁县| 东阳市| 兰州市| 元阳县| 宝兴县| 高州市| 弋阳县| 庄浪县| 吉首市| 斗六市| 荥经县| 大渡口区| 长葛市| 沈阳市| 包头市| 林州市| 屯昌县| 牡丹江市| 漳浦县| 博爱县|