Closed adk23333 closed 1 year ago
这个一般是ip最近请求次数太多导致的吧。我一开始以为和这个 https://github.com/Starry-OvO/aiotieba/issues/123 有关联
这个一般是ip最近请求次数太多导致的吧。我一开始以为和这个 Starry-OvO/aiotieba#123 有关联
现在是这个报错了,在test的情况下,是正常的no test就报以下错误,换了网络试验也是如此。
<2023-05-20 13:08:36.346> [WARN] [get_posts] Timeout to read. tid=6310389445
<2023-05-20 13:08:36.346> [WARN] [get_posts] Timeout to read. tid=8322878361
<2023-05-20 13:08:36.346> [WARN] [get_posts] Timeout to read. tid=8305409598
<2023-05-20 13:08:36.347> [WARN] [get_posts] Timeout to read. tid=7834300682
<2023-05-20 13:08:36.347> [WARN] [get_posts] Timeout to read. tid=8026909560
<2023-05-20 13:08:36.347> [WARN] [get_posts] Timeout to read. tid=8364486004
<2023-05-20 13:08:36.348> [WARN] [get_posts] Timeout to read. tid=8354058936
这次试验是直接copy例程了 稍微修改了这部分
async def check_text(obj: TypeObj) -> Optional[Punish]:
text = obj.text
_check_text = ["123456"]
for i in _check_text:
if re.search(i, text):
return Punish(obj, Ops.DELETE, note="适用于3级以下用户的违规词汇")
淦,找到问题了,昨天我的网页端的cookie里面STOKEN不知道为什么有两个,复制错了。。。
Error parsing message 这个一般是ip最近请求次数太多导致的吧。
是protobuf接口?大概率是服务端偶尔会返回的一坨html为了保护您的账号安全和最佳的浏览体验,当前业务已经不支持IE8以下浏览器
https://github.com/n0099/TiebaMonitor/blob/9694b66200462c5377cf85aef687f21cfab33d71/c%23/crawler/src/Tieba/ClientRequester.cs#L52 而html字符串自然不是合法的protobuf encoding二进制
我一开始以为和这个 Starry-OvO/aiotieba#123 有关联
那个issue中目前只会是110001未知错误
怪了,get_posts
跟STOKEN应该没有关系啊
怪了,
get_posts
跟STOKEN应该没有关系啊
但换了个今天的网页里的STOKEN就好了,总之挺奇怪的🤔之后没复现了 还有你handler例程第254行,又漏了那三个参数没填
那三个参数刚改完了
经典相关即因果 https://en.wikipedia.org/wiki/Correlation_does_not_imply_causation 所以为什么爬帖子时要带上自己百度号的登录态cookie?您巴不得百度cdn网管注意到您在疯狂刷贴吧吗
那三个参数刚改完了
不过最近还有另一个问题,虽然主要功能都能正常使用
<2023-05-21 08:53:23.321> [WARN] [get_threads] (110004, ''). fname=****
每一次扫描都有这个日志警告,扫描间隔是30s
reply to n0099: 有些功能只有带上BDUSS才有,比如楼中楼 reply to adk23333: 家庭ip很容易频繁,我几个服务器虽然偶尔有但不影响功能,当然我也不确定是不是我省参数导致的
有些功能只有带上BDUSS才有,比如楼中楼
您是说主题帖回复贴列表
接口中附带的每层回复楼中楼?https://github.com/Starry-OvO/aiotieba/blob/2b8459f5da25d204cc58077a3480b8f0cc453048/aiotieba/client.py#L534
单独请求楼中楼接口是无需登录态的
(110004, '')
110004是贴吧服务端response中的error_code
值?''
空字符串是他返回的error_msg
?这类response的http status code是什么?429吗?
家庭ip很容易频繁,我几个服务器虽然偶尔有但不影响功能
然而国内归属地的ip请求域c.tieba.baidu.com
的rqs限制是30rqs,而国外归属地ip只有10rps https://github.com/Starry-OvO/aiotieba/issues/82#issuecomment-1381728181
reply to adk23333: 家庭ip很容易频繁,我几个服务器虽然偶尔有但不影响功能,当然我也不确定是不是我省参数导致的
我服务器是香港的,内地要备案麻烦,我试试把时间间隔调的更大。
服务器是香港的,内地要备案
您不建http站不需要备案只需要平台实名
把时间间隔调的更大
没有自动重试?
您不建http站不需要备案只需要平台实名
准备建站的服务器,顺便搭一下这个
没有自动重试?
Strray的reviewer例程直接照搬的,我不喜欢造轮子。这个例程的功能已经基本满足需求了。你看我的仓库 里的网页截图就知道需求又多简单了
环境是py3.10 以及最新的aiotieba和reviewer 使用--no_test参数 报错如下