Open zhechenghu opened 1 year ago
No response
当前解析pdf文档的模式主要是针对论文,相对于书籍有以下几个不匹配的地方:
当尝试解析英文书籍时,可能会在目录中遇到Reference:
此时会直接停下来,无法解析后面内容。
此外,书籍的最后可能会有index内容:
这些不会被目前的模式匹配到,但也有可能混淆内容检索。
在阅读书籍时,读者或许不会期望一次解析完全文,或许只是希望针对某个章节提问。
希望可以增加书籍模式,比如可以指定页数解析(这或许也可以解决书籍一次性解析完太消耗内存的问题,当然我理解这样可能会造成持久化储存的不方便,只是一个建议)。
总之非常感谢您开发的这个插件!
可以考虑加入的,因为我平时接触书籍不多,后面加入。
reference停止是因为,参考文献往往会对askpdf造成干扰,所以不读取它。但有时候会导致pdf读取错误停止
这个问题是否已有issue
运行环境
当前配置信息
No response
问题详情
当前解析pdf文档的模式主要是针对论文,相对于书籍有以下几个不匹配的地方:
当尝试解析英文书籍时,可能会在目录中遇到Reference:
此时会直接停下来,无法解析后面内容。
此外,书籍的最后可能会有index内容:
这些不会被目前的模式匹配到,但也有可能混淆内容检索。
在阅读书籍时,读者或许不会期望一次解析完全文,或许只是希望针对某个章节提问。
希望可以增加书籍模式,比如可以指定页数解析(这或许也可以解决书籍一次性解析完太消耗内存的问题,当然我理解这样可能会造成持久化储存的不方便,只是一个建议)。
总之非常感谢您开发的这个插件!
补充说明
No response