dataabc / weibo-crawler

新浪微博爬虫,用python爬取新浪微博数据,并下载微博图片和微博视频
3.22k stars 737 forks source link

求助-爬微博进度100%,但是数量明显跟实际数量不一致有可能是何原因? #424

Closed wendywjhu closed 3 months ago

wendywjhu commented 3 months ago
image

在执行过程中,还有一个日志是写入MYSQL的日志,那个日志看着数量级是对的,但是最终落入MYSQL的数量不对。

dataabc commented 3 months ago

有可能是之前部分微博已经写入数据库了,程序只将数据库没有的内容写入,所以数量会少。

wendywjhu commented 3 months ago

有可能是之前部分微博已经写入数据库了,程序只将数据库没有的内容写入,所以数量会少。

可能是cookie的原因,从日志上看到2000条后打的日志就不太正常了,内容就打印不出来了,回来翻看文档,发现可能是cookie的原因,我去设置一下先

wendywjhu commented 3 months ago

解决了,是cookie的原因。