Open myrainbowandsky opened 4 years ago
1.你是怎么操作的? 一台机器上默认开启所有任务。 celery -A tasks.workers worker -l info -c 1
2.你期望的结果是什么? 转推所有相关信息,包括: 1.转推数, 2.所有转推人列表 3.转推的原作者, 4.原围脖发送时间, 5.原微博内容,
3.实际上你得到的结果是什么?
执行:python3 first_task_execution/repost_first.py 得到:2020-02-28 17:32:42 - crawler - INFO - There are 11836 repost urls have to be crawled 然后就没了
在抓取用户信息时 执行 celery -A tasks.workers -Q login_queue,fans_followers worker -l info -c 1 得到
请问UI界面的用户信息是不是我抓取的微博的博主的信息,还是随机抓取的?也就是说必须先有种子数据(先抓取一定量的微博)才能再抓取相对应的其他信息,如果不抓取任何微博,其他一切数据抓取都是0。
这个“第一页之后”是什么意思?
mysql里面有一个user_relation 是储存什么用的?任何一个任务都无法填充这个表。
在UI界面内的“微博信息”的用户ID和“用户信息”里的用户ID无法在对方搜索栏中找到。 “用户信息”是🈯️哪些用户?是转发的用户?微博信息是博主信息?
执行所有任务时报错。
在UI界面上,找不到转推信息,怎么设置才能看见。还是说要去mysql手动找? 评论,点赞,回复数为什么是0呢
4.你使用的是哪个版本的WeiboSpider? 你的操作系统是什么?是否有读本项目的常见问题? UBUNTU18.04,master
第一页之后是ajax请求时的页数, 请稍微了解一下网页版微博的网络请求流程 见数据库表字段说明
5.如何向 user_relation 填入数据?
默认会在抓取用户信息的时候抓取其关注和粉丝列表, 见此
谢谢,其他问题可以解答一下吗
UI界面从未使用过, 等待他人回复吧
我这里抓下来的微博评论,点赞,回复数也都是0,执行的search任务。是否网页结构发生改变导致解析有问题。
1.你是怎么操作的? 一台机器上默认开启所有任务。 celery -A tasks.workers worker -l info -c 1
2.你期望的结果是什么? 转推所有相关信息,包括: 1.转推数, 2.所有转推人列表 3.转推的原作者, 4.原围脖发送时间, 5.原微博内容,
3.实际上你得到的结果是什么?
执行:python3 first_task_execution/repost_first.py 得到:2020-02-28 17:32:42 - crawler - INFO - There are 11836 repost urls have to be crawled 然后就没了
在抓取用户信息时 执行 celery -A tasks.workers -Q login_queue,fans_followers worker -l info -c 1 得到
请问UI界面的用户信息是不是我抓取的微博的博主的信息,还是随机抓取的?也就是说必须先有种子数据(先抓取一定量的微博)才能再抓取相对应的其他信息,如果不抓取任何微博,其他一切数据抓取都是0。
这个“第一页之后”是什么意思?
mysql里面有一个user_relation 是储存什么用的?任何一个任务都无法填充这个表。
在UI界面内的“微博信息”的用户ID和“用户信息”里的用户ID无法在对方搜索栏中找到。 “用户信息”是🈯️哪些用户?是转发的用户?微博信息是博主信息?
执行所有任务时报错。
在UI界面上,找不到转推信息,怎么设置才能看见。还是说要去mysql手动找? 评论,点赞,回复数为什么是0呢
4.你使用的是哪个版本的WeiboSpider? 你的操作系统是什么?是否有读本项目的常见问题? UBUNTU18.04,master