mixmoe / HibiAPI

一个实现了多种常用站点的易用化API的程序 / A program that implements easy-to-use APIs for a variety of commonly used sites.
https://api.obfs.dev
Apache License 2.0
548 stars 83 forks source link

有谁知道贴吧post detail返回的json里可能包含几种content吗 #359

Open donmor opened 2 years ago

donmor commented 2 years ago

最近在写爬虫,关于贴吧api的post detail返回的json里面,post_list/{0}/content/{0}/type的值对应app里的内容类型,自己试出这些: 0,文本 1,链接 2,黄豆表情 3,图片 4,楼中楼回复对象用户名 5,视频(短视频贴包含视频文件uri,老贴一般只有一个到56之类网站的外链) 9,号码 除此之外还有哪些种类?中间678还没见过

donmor commented 2 years ago

另外size和page参数怎么用?文档里没弄明白,一直只能取到30多层

mnixry commented 2 years ago

除此之外还有哪些种类?中间678还没见过

0. 文本
1. 链接
2. 表情
3. 图片
4. 艾特
5. 视频
7. 换行
9. 电话号码
10. 语音
11. 动态表情
16. 涂鸦
17. 活动
18. 热议
20. 贴吧动图

之前其他网友逆出来的, 不知道还有没有补充 (Enum中间缺几个数不是很正常吗)

mnixry commented 2 years ago

另外size和page参数怎么用?文档里没弄明白,一直只能取到30多层

我刚刚测试了一下是没有问题的, 你看看是不是你那个贴只有三十多层

如果你确实觉得翻页有问题, 可以贴上相关代码和测试用的帖子ID以便于复现 (最好能开个新issue)

这是我测试用的帖子:

https://api.obfs.dev/api/tieba/post_detail?tid=1766018024&page=2&size=50&reversed=false
https://api.obfs.dev/api/tieba/subpost_detail?tid=1766018024&pid=22616319749&page=3&size=50

都是没有问题的

donmor commented 2 years ago

楼层解决了,page从一一直加到返回的json不再变化可破 7 10 16 17 20有没有帖子可以试验一下的?

donmor commented 2 years ago

20已破:) 10那个语音有人研究过吗?回包里只有个md5,扒页面也没找到怎么获得真实地址

donmor commented 2 years ago

更:16已破 另外投票解析不出来啊,[请更新到贴吧App最新版本查看投票模块]

mnixry commented 2 years ago

另外投票解析不出来啊,[请更新到贴吧App最新版本查看投票模块]

我过会看看能不能把上报的贴吧版本提一下 看看能不能用👀 这个你开个新issue吧 方便追踪修复

7 10 16 17 20有没有帖子可以试验一下的?

没有 这个是我根据很久以前的一些遗留代码找的 它只处理了文本内容