Closed guotong1988 closed 8 years ago
比如豆瓣这个例子https://github.com/geekan/scrapy-examples/blob/master/doubanbook/doubanbook/spiders/douban_spider.py
Rule(sle(allow=("/subject/\d+/?$")), callback='parse_2'), 这句话是在主页面内匹配subject
Rule(sle(allow=("/subject/\d+/?$")), callback='parse_2'),
不太清楚抓取子页面里的东西的是哪句代码?
parse_2这个函数,表明是第二层的解析
多谢!! 可是parse_1没有被调用??
这只是一个demo,一层在这里并不需要解析(是列表页),我们的目标是抽取内容
赞!我有点会用了,下一步是获取 下一页下几页 的内容~就是内容是个列表,这个列表是分多页展示的~
是的,注意正则规则,你可以把翻页的链接写到正则里,让scrapy自动follow
比如豆瓣这个例子https://github.com/geekan/scrapy-examples/blob/master/doubanbook/doubanbook/spiders/douban_spider.py
Rule(sle(allow=("/subject/\d+/?$")), callback='parse_2'),
这句话是在主页面内匹配subject不太清楚抓取子页面里的东西的是哪句代码?