最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

建立屬于自己的代理IP池

2020-05-28 22:29 作者:每日一遍__以防抑郁  | 我要投稿

python : 免費代理IP獲取,驗證可用性,建立屬于自己的代理ip池

在進行爬蟲爬取網(wǎng)站時候總會面臨著各種各樣的反爬措施,最讓人頭疼的一般就是封IP地址了,這時候使用代理IP就是一個明智的選擇了。

建立屬于自己的代理IP池是進行爬蟲的一個很高效的辦法。

網(wǎng)上存在著大量的免費代理IP網(wǎng)站,以下選取一個較為好用的代理IP網(wǎng)站進行爬取,建立屬于自己的代理IP池。(西祠代理、快代理等等)


代碼如下(獲取西祠代理的可用高匿代理IP)

import requests,parsel,telnetlib

from fake_useragent import UserAgent

ua = UserAgent()

# 高匿代理網(wǎng)址 可以自行更換其他西祠代理網(wǎng)頁內(nèi)部

header = {"User-Agent":ua.random}

# 運行結(jié)果保存在代理txt文件中

url = "https://www.xicidaili.com/nn/"

seeeion = requests.session()


# 提取網(wǎng)頁源代碼

def request(url):

? ? res = seeeion.get(url, headers=header)

? ? html = parsel.Selector(res.text)

? ? return html


# def test()


# 提取網(wǎng)頁數(shù)據(jù)

def extract(html):

? ? # 提取ID列表以及URL列表

? ? id_list = html.xpath('//tr/td[2]/text()').extract()

? ? post_list = html.xpath('//tr[@class]/td[3]/text()').extract()

? ? print(len(id_list))

? ? for id, post in zip(id_list, post_list):

? ? ? ? try:

? ? ? ? ? ? telnetlib.Telnet(id, post, timeout=5)

? ? ? ? ? ? ip = id + ":" + post

? ? ? ? ? ? print("通過第一關:",ip)

? ? ? ? ? ? url = 'https://www.baidu.com'

? ? ? ? ? ? response = requests.get(url,timeout=5, proxies={"https":ip})

? ? ? ? ? ? if (response.status_code == 200):

? ? ? ? ? ? ? ? print("通過第二關:",ip,"=================")

? ? ? ? ? ? ? ? with open('F:\Python文件\代理IP\代理.txt', "a") as fp:

? ? ? ? ? ? ? ? ? ? fp.write(ip + "\n")

? ? ? ? ? ? ? ? # print("header : ", response.text)

? ? ? ? except Exception as e:

? ? ? ? ? ? pass

? ? ? ? ? ? # print(e, '不可用')


? ? ? ? # 在這里添加一個函數(shù)進行對IP檢測,是否可用

? ? print("完成")


try:

? ? # 提取總頁數(shù)

? ? html = request(url)

? ? page = html.xpath('//div[@class="pagination"]/a[10]/text()').extract_first()

? ? page = int(page)

? ? extract(html)

? ? # 分頁抓取

? ? for i in list(range(2,4)):? ? # 逐頁發(fā)起請求? (page+1)

? ? ? ? url1 = url + str(i)

? ? ? ? html = request(url1)

? ? ? ? extract(html)


except:

? ? print("出現(xiàn)bug,請修改")



建立屬于自己的代理IP池的評論 (共 條)

分享到微博請遵守國家法律
长春市| 罗山县| 成武县| 杭州市| 双江| 肃宁县| 五原县| 揭东县| 遵义县| 眉山市| 稻城县| 兴仁县| 安新县| 湟中县| 安康市| 祁阳县| 江源县| 苍梧县| 阿鲁科尔沁旗| 阳春市| 略阳县| 黔江区| 德清县| 鸡东县| 扶风县| 永修县| 中西区| 哈尔滨市| 孟连| 衢州市| 贵定县| 建水县| 新密市| 霍城县| 宜兴市| 桓台县| 大新县| 简阳市| 荃湾区| 大同县| 安徽省|