Python爬虫:Scrapy从脚本运行爬虫的5种方式！

风声之家 2021-06-08

展开全文

Python爬虫:Scrapy从脚本运行爬虫的5种方式！

Python编程学习圈 1周前

关注+星标，每天学习Python新技能

测试环境

一、命令行运行爬虫

1、编写爬虫文件 baidu.py

图片

2、运行爬虫（2种方式）

图片

二、文件中运行爬虫

1、cmdline方式运行爬虫

图片

2、CrawlerProcess方式运行爬虫

图片

3、通过CrawlerRunner 运行爬虫

图片

三、文件中运行多个爬虫

项目中新建一个爬虫 SinaSpider

图片

1、cmdline方式不可以运行多个爬虫

如果将两个语句放在一起，第一个语句执行完后程序就退出了，执行到不到第二句

图片

不过有了以下两个方法来替代，就更优雅了

2、CrawlerProcess方式运行多个爬虫

备注：爬虫项目文件为：

scrapy_demo/spiders/baidu.py

scrapy_demo/spiders/sina.py

图片

此方式运行，发现日志中中间件只启动了一次，而且发送请求基本是同时的，说明这两个爬虫运行不是独立的，可能会相互干扰

3、通过CrawlerRunner 运行多个爬虫

图片

此方式也只加载一次中间件，不过是逐个运行的，会减少干扰，官方文档也推荐使用此方法来运行多个爬虫

总结

图片

cmdline.execute 运行单个爬虫文件的配置最简单，一次配置，多次运行

*声明：本文于网络整理，版权归原作者所有，如来源信息有误或侵犯权益，请联系我们删除或授权事宜。

图片

阅读原文

阅读 187

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：风声之家 > 《python》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

风声之家

关注对话

TA的最新馆藏

儿子带对象回家，妈妈做的午餐火了，网友：有这婆婆，还缺儿媳妇不？
一款可以傻瓜版本使用的专业作图AI
大人孩子都爱它，外酥里糯，香气四溢，一口下去嘎嘎香
手把手教你做农家鱼香茄子饭，出锅鲜香入味，比饭店还好吃，解馋！
煮米饭别再老一套了，教你懒人做法，饭菜一锅出，学会不点外卖了
刮几根手指，一次搞定十几种病，太实用了！

喜欢该文的人也喜欢更多

热门阅读换一换