散文網(wǎng) » 筆記 »全部筆記 » 黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架

2023-08-26 15:40 作者:明明ai小明 0人讀過(guò) | 我要投稿

#拿到頁(yè)面原地阿瑪
#拿到所有ul上面得a標(biāo)簽

from lxml import etree
import re
import requests
import json
domain = 'https://desk.zol.com.cn'
url = 'https://desk.zol.com.cn/'
resp = requests.get(url)
resp.encoding = 'gbk'
# print(resp.text)
et = etree.HTML(resp.text)
result = et.xpath('//ul[@class="pic-list2 clearfix"]/li/a/@href')
# print(result)

for item in result:
    url = domain + item
    print(url)
    # url = 'https://desk.zol.com.cn/bizhi/10055_120350_2.html'
    resp = requests.get(url)
    # print(resp.text)
    obj = re.compile(r'var deskPicArr.*?=(?P<deskPicArr>.*?);',re.S)
    result = obj.search(resp.text)
    deskPicArr = result.group('deskPicArr')
    # print(deskPicArr)
    dic = json.loads(deskPicArr)
    # print(dic)
    for item in dic['list']:
        oriSize = item.get('oriSize')
        imgsrc = item.get('imgsrc')
        # print(oriSize,imgsrc)
        imgsrc = imgsrc.replace('##SIZE##',oriSize)
        print(imgsrc)
        #發(fā)送網(wǎng)絡(luò)請(qǐng)求
        name = imgsrc.split('/')[-1]
        resp_img = requests.get(imgsrc)
        #此時(shí)拿到的不是resp.text, resp.content拿到的是字節(jié)
        with open(f"img/{name}",mode="wb") as f:
            f.write(resp_img.content)
            # print(f)

標(biāo)簽：

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架的評(píng)論 (共條)

愛(ài)情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩(shī)歌空間日志經(jīng)典語(yǔ)句愛(ài)情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架

本文作者的其他文章

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架

黑馬程序員Python爬蟲(chóng)基礎(chǔ)，快速入門Scrapy爬蟲(chóng)框架的評(píng)論 (共條)