Closed EachSheep closed 1 year ago
--max_results 100 一般来说太长了,中间出现一个文档错误,就全寄了。token长度那个,其实有try except的方案,但是我目前不想加,因为比较麻烦,会带来新的bug,所以一直没加,一般遇到这种情况,建议换一篇文章就好了。目前的脚本可以处理9成左右的文档。最难顶的是pdf的格式太乱了,改了A,可能会有B的问题。
--max_results 100 一般来说太长了,中间出现一个文档错误,就全寄了。token长度那个,其实有try except的方案,但是我目前不想加,因为比较麻烦,会带来新的bug,所以一直没加,一般遇到这种情况,建议换一篇文章就好了。目前的脚本可以处理9成左右的文档。最难顶的是pdf的格式太乱了,改了A,可能会有B的问题。
感谢感谢,我其实在issue里面看到相关问题的回答了,只是觉得在搜索arXiv文章时断掉不能续接怪怪的。
既然加上太多的try会出现bug,不如先考虑加个try,然后直接跳过这篇文章?反正看arXiv文章一般漏掉个几篇问题也不大。
--max_results 100 一般来说太长了,中间出现一个文档错误,就全寄了。token长度那个,其实有try except的方案,但是我目前不想加,因为比较麻烦,会带来新的bug,所以一直没加,一般遇到这种情况,建议换一篇文章就好了。目前的脚本可以处理9成左右的文档。最难顶的是pdf的格式太乱了,改了A,可能会有B的问题。
感谢感谢,我其实在issue里面看到相关问题的回答了,只是觉得在搜索arXiv文章时断掉不能续接怪怪的。
既然加上太多的try会出现bug,不如先考虑加个try,然后直接跳过这篇文章?反正看arXiv文章一般漏掉个几篇问题也不大。
如果您愿意的话我可以提个pr,但是感觉需要加的代码行数不是很多,可能也就几行,感觉没必要提pr了,您是否考虑一下?
确实也有道理,毕竟批量检索,出现问题卡住,很难受,而且再续也有问题。我回头还是加个try吧,大概一两天内
感谢!
On Thu, Apr 6, 2023 at 12:35 AM kaixindelele @.***> wrote:
确实也有道理,毕竟批量检索,出现问题卡住,很难受,而且再续也有问题。我回头还是加个try吧,大概一两天内
— Reply to this email directly, view it on GitHub https://github.com/kaixindelele/ChatPaper/issues/157#issuecomment-1497793057, or unsubscribe https://github.com/notifications/unsubscribe-auth/ALTWEXAZZZJX7NVJ27CASWDW7WNLRANCNFSM6AAAAAAWUJKOLA . You are receiving this because you authored the thread.Message ID: @.***>
猜测原因:OpenAI接口似乎对提问的token数进行了限制。
我在调取最新的arXiv文章时出现以下错误:
是否有办法解决?