最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

Python爬蟲:Scrapy從腳本運(yùn)行爬蟲的5種方式!

2021-06-17 10:28 作者:golang教程  | 我要投稿

測試環(huán)境


一、命令行運(yùn)行爬蟲
1、編寫爬蟲文件 baidu.py

2、運(yùn)行爬蟲(2種方式)


二、文件中運(yùn)行爬蟲


1、cmdline方式運(yùn)行爬蟲


2、CrawlerProcess方式運(yùn)行爬蟲

3、通過CrawlerRunner 運(yùn)行爬蟲

三、文件中運(yùn)行多個(gè)爬蟲


項(xiàng)目中新建一個(gè)爬蟲 sinaSpider

1、cmdline方式不可以運(yùn)行多個(gè)爬蟲
如果將兩個(gè)語句放在一起,第一個(gè)語句執(zhí)行完后程序就退出了,執(zhí)行到不到第二句

不過有了以下兩個(gè)方法來替代,就更優(yōu)雅了
2、CrawlerProcess方式運(yùn)行多個(gè)爬蟲
備注:爬蟲項(xiàng)目文件為:scrapy_demo/spiders/baidu.pyscrapy_demo/spiders/sina.py

此方式運(yùn)行,發(fā)現(xiàn)日志中中間件只啟動(dòng)了一次,而且發(fā)送請(qǐng)求基本是同時(shí)的,說明這兩個(gè)爬蟲運(yùn)行不是獨(dú)立的,可能會(huì)相互干擾
3、通過CrawlerRunner 運(yùn)行多個(gè)爬蟲

此方式也只加載一次中間件,不過是逐個(gè)運(yùn)行的,會(huì)減少干擾,官方文檔也推薦使用此方法來運(yùn)行多個(gè)爬蟲

總結(jié)

cmdline.execute 運(yùn)行單個(gè)爬蟲文件的配置最簡單,一次配置,多次運(yùn)行

文章轉(zhuǎn)載:Python編程學(xué)習(xí)圈(版權(quán)歸原作者所有,侵刪)

五份資料已打包好,需要的朋友可以微信掃描下方二維碼獲取資料。


Python爬蟲:Scrapy從腳本運(yùn)行爬蟲的5種方式!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
图们市| 邓州市| 昌江| 都江堰市| 盱眙县| 贺州市| 柳江县| 江山市| 盐边县| 渝北区| 清远市| 青州市| 靖西县| 二手房| 浪卡子县| 桂林市| 张家口市| 博客| 绩溪县| 烟台市| 上蔡县| 宁城县| 呼图壁县| 额尔古纳市| 苍溪县| 宣恩县| 陵川县| 晋宁县| 烟台市| 连平县| 赞皇县| 长沙县| 新巴尔虎左旗| 前郭尔| 虞城县| 城步| 墨江| 明溪县| 商城县| 乌恰县| 孙吴县|