Open LOUISELUO2023 opened 11 months ago
感谢反馈。因为默认命令行会按照进度文件继续执行之前的任务,如果更换关键词,需要把命令行crawls之后的部分换成其它名字,名字只有符合规范即可。
谢谢您的解答。我按照您的建议修改了命令,但是新的问题变成了微博网页里有无法识别的字符阻碍进程,好像是一个emoji。GPT提供的修改方案没法解决问题,想请问一下您有没有可以补上去的代码?谢谢!
更新:问题已经解决了,把search.py里的print(weibo)关掉就好,也不用补充其他print相关的代码。
下面是报错的内容:
2023-11-22 10:31:08 [scrapy.core.scraper] ERROR: Spider error processing <GET https://s.weibo.com/weibo?q=%23%E8%AF%B7%E5%A4%A7%E8%8B%B1%E5%8D%9A%E7%89%A9%E9%A6%86%E6%97%A0%E5%81%BF%E5%BD%92%E8%BF%98%E4%B8%AD%E5%9B%BD%E6%96%87%E7%89%A9#%20#%E9%80%83%E5%87%BA%E5%A4%A7%E8%8B%B1%E5%8D%9A%E7%89%A9%E9%A6%86%23&typeall=1&suball=1×cope=custom:2023-08-27-0:2023-09-10-0> (referer: None) Traceback (most recent call last): …… File "C:\Users\Administrator\weibo-search\weibo\spiders\search.py", line 538, in parse_weibo print(weibo) UnicodeEncodeError: 'gbk' codec can't encode character '\U0001f44d' in position 449: illegal multibyte sequence
运行第一次的时候生成了一个结果文件;后来更换了关键词并重启了Spyder,重新运行scrapy之后只会把结果输出到前一个结果文件里
这个我觉得有一个很简单的解决办法,你可以把第一次的运行结果改个名字就好了,这样你更改关键词,再scrapy会产生新的文件夹
运行第一次的时候生成了一个结果文件;后来更换了关键词并重启了Spyder,重新运行scrapy之后只会把结果输出到前一个结果文件里