Well2333 / nonebot-plugin-bilichat

一个通过 OpenAI 来对b站视频进行总结的多功能 B站解析插件
GNU Affero General Public License v3.0
221 stars 8 forks source link

Bug: 专栏解析 API 调用出错:list index out of range #228

Closed DreamGallery closed 1 month ago

DreamGallery commented 1 month ago

操作系统

Windows

Python 版本

3.12

NoneBot 版本

2.0

Bilichat 版本

latest

描述问题

随便找了几个专栏试了一下,似乎就是专栏开头是文字的可以解析,但是开头是图片的解析不了 这个就是不行的 https://www.bilibili.com/read/cv35721905/ image 这个可以 https://www.bilibili.com/read/cv34697133/ image

不行的F12看网页的确是搜不到这个//div[@id="read-article-holder"]

插件的配置项

No response

截图或日志

No response

Well2333 commented 1 month ago

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

DreamGallery commented 1 month ago

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

我试过挺多次开头是图片的专栏好像就是不行,然后直接F12查看网页元素没有//div[@id="read-article-holder"]

DreamGallery commented 1 month ago

image image

Well2333 commented 1 month ago

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

我试过挺多次开头是图片的专栏好像就是不行,然后直接F12查看网页元素没有//div[@id="read-article-holder"]

我这里怎么刷新都是有的,而且使用 inprivate 模式也能稳定存在,尝试修改为移动端 edge 的 UI 也可稳定存在

Well2333 commented 1 month ago

image

DreamGallery commented 1 month ago

image

这个是正常的,不正常的是开头是图片的 https://www.bilibili.com/read/cv35721905 试过几个其他的也是一样 比如这个开头是图片也是不行的 https://www.bilibili.com/read/cv35967927

Well2333 commented 1 month ago

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 此问题将在下个版本修复。

DreamGallery commented 1 month ago

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 此问题将在下个版本修复。

辛苦了,有些专栏的文字是会出现在最后的,这点也要稍微考虑下

Well2333 commented 1 month ago

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 此问题将在下个版本修复。

辛苦了,有些专栏的文字是会出现在最后的,这点也要稍微考虑下

此问题无需考虑,因为搜索是根据 id 进行检索,类似 ctrl f ,因此顺序没有任何影响

DreamGallery commented 1 month ago

此问题无需考虑,因为搜索是根据 id 进行检索,类似 ctrl f ,因此顺序没有任何影响

就像我之前说的,文字不是在开头出现的就没有read-article-holder,如果后面的文字使用其他xpath去匹配的那没问题了