yidao620c / comments

用来存储用户评论
MIT License
1 stars 0 forks source link

Scrapy笔记10- 动态配置爬虫 | 飞污熊博客 #719

Open yidao620c opened 1 year ago

yidao620c commented 1 year ago

https://www.xncoding.com/python/scrapy/scrapy-10.html

有很多时候我们需要从多个网站爬取所需要的数据,比如我们想爬取多个网站的新闻,将其存储到数据库同一个表中。我们是不是要对每个网站都得去定义一个Spider类呢? 其实不需要,我们可以通过维护一个规则配置表或者一个规则配置文件来动态增加或修改爬取规则,然后程序代码不需要更改就能实现多个网站爬取。 要这样做,我们就不能再使用前面的scrapy crawl test这种命令了,我们需要使用编程的方式运行S