最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

論壇

2023-03-09 19:38 作者:一個普通的優(yōu)菈廚  | 我要投稿

import requests,os,re

from lxml import etree

class Spider:

? ? def __init__(self):

? ? ? ? self.__site="http://39.106.228.59"

? ? ? ? self.__file=f"{os.getcwd()}/data.txt"

? ? ? ? self.__maxPage=1


? ? def __getPostID(self,pageURL):

? ? ? ? header={

? ? ? ? ? ? "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36"

? ? ? ? }

? ? ? ? ids=[]

? ? ? ? response=requests.get(pageURL,headers=header)

? ? ? ? if response.status_code==200:

? ? ? ? ? ? html=etree.HTML(response.text)


? ? ? ? ? ? hrefs=html.xpath('//a[@class="s xst"]/@href')

? ? ? ? ? ? for href in hrefs:

? ? ? ? ? ? ? ? postID=self.__parseID(href)

? ? ? ? ? ? ? ? ids.append(self.__parseID(href))

? ? ? ? return ids

? ? def __getPostData(self,postID):

? ? ? ? base=self.__site+"/forum.php?mod=viewthread&tid={}&extra=page%3D1"

? ? ? ? header={

? ? ? ? ? ? "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36"

? ? ? ? }

? ? ? ? response=requests.get(base.format(postID),headers=header)

? ? ? ? if response.status_code==200:

? ? ? ? ? ? html=etree.HTML(response.text)

? ? ? ? ? ? xis=html.xpath('//a[@class="xi2"]/text()')


? ? ? ? ? ? user=xis[3]


? ? ? ? ? ? score=xis[4]


? ? ? ? ? ? level=html.xpath(f'//div[@id="favatar{postID}"]//p[1]/em[1]/a[1]/text()')[0]


? ? ? ? ? ? title=html.xpath('//span[@id="thread_subject"]/text()')[0]


? ? ? ? ? ? content=html.xpath(f'//td[@id="postmessage_{postID}"]/text()')[0].strip()

? ? ? ? ? ? data=f"{postID}\t{user}\t{score}\t{level}\t{title}\t{content}\n"

? ? ? ? ? ? return data

? ? def __parseID(self,url):

? ? ? ? reg=r".*tid=(.*?)\&.*"

? ? ? ? result=re.findall(reg,url)

? ? ? ? if len(result)>0:

? ? ? ? ? ? return result[0]


? ? def __makePageURL(self):

? ? ? ? base=self.__site+"/forum.php?mod=forumdisplay&fid=2&page={}"

? ? ? ? urls=[]

? ? ? ? for num in range(1,self.__maxPage+1):

? ? ? ? ? ? urls.append(base.format(num))

? ? ? ? return urls

? ? def run(self):

? ? ? ? urls=self.__makePageURL()

? ? ? ? file=open(self.__file,"a+",encoding="utf8")

? ? ? ? for url in urls:

? ? ? ? ? ? ids=self.__getPostID(url)

? ? ? ? ? ? for id in ids:

? ? ? ? ? ? ? ? data=self.__getPostData(id)

? ? ? ? ? ? ? ? file.write(data)

? ? ? ? file.close()

if __name__=="__main__":

? ? spider=Spider()

? ? spider.run()


論壇的評論 (共 條)

分享到微博請遵守國家法律
湖北省| 甘洛县| 普格县| 托克逊县| 雷州市| 东宁县| 卓资县| 宜兰市| 永吉县| 徐闻县| 康马县| 阿克陶县| 皮山县| 安义县| 沾益县| 安国市| 泸州市| 台北市| 民勤县| 晋中市| 资源县| 旅游| 武义县| 噶尔县| 奉节县| 福贡县| 乐都县| 米泉市| 买车| 漳浦县| 慈利县| 吴旗县| 陇南市| 万源市| 修水县| 安庆市| 龙海市| 渝中区| 都匀市| 呼玛县| 彰武县|