-
-
0.71版本downloader的时候就会打印页面到控制台,这样就产生很多日志文件,在查看其他的日志时就很不方便,如果改变日记等级其他的日志我都看不到了,我觉得这个打印页面的不用要。
-
https://telegra.ph/%E6%89%93%E5%B7%A5%E4%BA%BA%E9%80%9F%E9%80%9F%E9%9B%86%E7%BB%93%E4%B8%80%E8%B5%B7%E6%8A%95%E5%87%BA2020%E5%B9%B4%E5%BA%A6%E5%8D%81%E5%A4%A7%E9%BB%91%E5%BF%83%E4%BC%81%E4%B8%9A-12-22
-
https://mp.weixin.qq.com/s/W1yP-1QkFHNIQFD0H_2-cQ
-
https://mp.weixin.qq.com/s/TSFKPySwgX1AHo8S9Nz3JQ
-
https://mp.weixin.qq.com/s/2QSxTUhuFie9qWexJPBsHQ
-
https://mp.weixin.qq.com/s/o2v4MZkvB05Nz-9FveULDQ
-
RegexField.extract()函数在接受etree._Element对象时会将其转换为字符串,当前的转换方法无法正常转换中文,会将中文转化为乱码。
下面这段代码似乎可以正常工作
```python3
if isinstance(html, etree._Element):
html = etree.tostring(html, encoding='utf-8', pr…
-
有个疑惑想请教一下您,就是如何只爬取用户某一年的全部微博, 比如说只爬取人民日报2019年发布的微博,我克隆您的代码运行的时候,我发现一开始是爬取2019年的微博,然后一段时间后突然就跳到了2012年,接着从2012年开始爬取,所以请问一下您,如果修改一下代码使得只爬取2019当年的一个数据?
-
It's related to #2905. When I'm using scrapy, I got the error "Failure instance: Traceback: : filedescriptor out of range in select()". So I want to try replacing the twisted reactor to pollreactor. H…