MuiseDestiny / zotero-gpt

GPT Meet Zotero.
GNU Affero General Public License v3.0
5.13k stars 208 forks source link

Feature request: Book mode #185

Open zhechenghu opened 1 year ago

zhechenghu commented 1 year ago

这个问题是否已有issue

运行环境

当前配置信息

No response

问题详情

当前解析pdf文档的模式主要是针对论文,相对于书籍有以下几个不匹配的地方:

  1. 当尝试解析英文书籍时,可能会在目录中遇到Reference:

    image

    此时会直接停下来,无法解析后面内容。

  2. 此外,书籍的最后可能会有index内容:

    image

    这些不会被目前的模式匹配到,但也有可能混淆内容检索。

  3. 在阅读书籍时,读者或许不会期望一次解析完全文,或许只是希望针对某个章节提问。

希望可以增加书籍模式,比如可以指定页数解析(这或许也可以解决书籍一次性解析完太消耗内存的问题,当然我理解这样可能会造成持久化储存的不方便,只是一个建议)。

总之非常感谢您开发的这个插件!

补充说明

No response

MuiseDestiny commented 1 year ago

可以考虑加入的,因为我平时接触书籍不多,后面加入。

MuiseDestiny commented 1 year ago

reference停止是因为,参考文献往往会对askpdf造成干扰,所以不读取它。但有时候会导致pdf读取错误停止