Open adk23333 opened 2 weeks ago
天才,我晚上看看
https://github.com/lumina37/aiotieba/issues/199#issuecomment-2133252453
https://github.com/lumina37/aiotieba/issues/124#issuecomment-1556355555
https://z.n0099.net/#narrow/near/73118
https://z.n0099.net/#narrow/near/97058
https://z.n0099.net/#narrow/near/14178
cc @BANKA2017
tl;dr: 爬截止2024年10月26日
的92亿个tid
总比爬1511亿个pid/spid
要快
天才,合理的
被删掉的贴子的内容也可以获取到
被删掉的跟正常的没有区分标记……有点意思但用不上了 :(
我突然想到,如果是为了获取主题帖/回复的内容,获取主题帖/楼中楼的接口也能做到吧,这个新接口有什么特别之处吗
我突然想到,如果是为了获取主题帖/回复的内容,获取主题帖/楼中楼的接口也能做到吧,这个新接口有什么特别之处吗
aiotieba提供的现有接口不都是获取一系列内容的吗,例如get_threads
,没法直接获取单条帖子的内容。
例如使用get_posts
再转到它所在的主题贴。再例如get_comments
获取楼中楼内容。
它们都需要遍历一下
这个直接请求到的就是需要的内容,不需要遍历
遍历
那叫递归
直接请求到的就是需要的内容
什么内容?给定tid
就有其下所有pid
/spid
的信息并且跟主题帖回复帖接口
pb/page
和回复帖楼中楼接口
pb/floor
所返回的相同?如果某tid
是有着几万回复帖的水楼或几千楼中楼的投票帖呢?有没有pn
/rn
分页?
所以这接口并不能像wap网页端
的mo_postreport
https://github.com/lumina37/aiotieba/issues/237#issuecomment-2439412416 那样绕过pid
/spid
软删除检测?那您为什么说
任意主题贴及回复
不是被删掉的贴子
简单测试了一下,不是被删掉的贴子的内容也可以获取到
如果可行,reviewer的遍历一遍列表来找到指定贴子及回复的方式可以暂时放一边了