-
我想着修改一下爬取微博的时候,不想爬取这么多内容,比如说我只想要微博内容和时间,应该在哪里修改?我在目录下面没有找到weibo_spider.py这个文件,有spider.py和weibo.py,请作者帮帮忙!
-
在抓取自己微博历史记录时,原程序一直抓不到,程序本身没有报错;抓取其他人的微博正常。
分析后发现微博地址更改下可用,在如下两处url后面增加“/profile",即可。
1:
`def get_weibo_info(self):
"""获取微博信息"""
try:
url = 'https://weibo.cn/%s/prof…
-
为了更好的解决问题,请认真回答下面的问题。等到问题解决,请及时关闭本issue。
- 问:请您指明哪个版本运行出错(github版/PyPi版/全部)?
答:github版
- 问:您使用的是否是最新的程序(是/否)?
答:是
- 问:爬取任意用户都会运行出错吗(是/否)?
答:是
- 问:若只有爬特定微博时才出错,能否提供出错微博的weibo_id或url(非必填)…
Cui-x updated
3 years ago
-
如题
----------------------------
Windows PowerShell
版权所有 (C) Microsoft Corporation。保留所有权利。
尝试新的跨平台 PowerShell https://aka.ms/pscore6
PS C:\Users\carlchen\workspace\temp> py .\spider.py
检查…
-
- 问:请说明需要什么新功能。
答:由于手头上的工作需要准确的数据,在使用中发现每次爬取数据个数都不同,都略有缺失。
- 问:请说明添加该功能的意义。(非必填)
答:
-
# Notary Application
To apply as a notary, please fill out the following form.
## Core Information
Name:YPOOL
(Optional) Affiliated Organization: YPOOL(https://ypool.io/major/home)
Website…
-
# Notary Application
To apply as a notary, please fill out the following form.
## Core Information
- Name:David
- Affiliated Organization: Diancun Tech
- Website / Social Media:https://dianc…
-
想问下爬取超话时发现一般只能爬几百条就停了如何让爬取的数量多些呢
-
感谢您申报bug,为了表示感谢,如果bug确实存在,您将出现在本项目的贡献者列表里;如果您不但发现了bug,还提供了很好的解决方案,我们会邀请您以pull request的方式成为本项目的代码贡献者(Contributor);如果您多次提供很好的pull request,我们将邀请您成为本项目的协助者(Collaborator)。当然,是否提供解决方按都是自愿的。不管是否是真正的bug、是否提供解…
-
运行出错的提示:
Traceback (most recent call last):
File "C:\Program Files\Python37\lib\site-packages\weibo_spider\parser\info_parser.py", line 42, in extract_user_info
"//div[@class='tip'][2]/text()…