Byaidu / PDFMathTranslate

PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker
https://pdf2zh.com
GNU Affero General Public License v3.0
3.07k stars 219 forks source link

图像参数传递格式有误 #93

Closed Wybxc closed 4 days ago

Wybxc commented 4 days ago

https://github.com/Byaidu/PDFMathTranslate/blob/4f45be5952156dd44e33ac627f5031dbf0855d9b/pdf2zh/high_level.py#L166-L172

按照 PyMuPDF 的文档PixMap.samples 得到的是 RGB 格式的图片,而 Yolov10 接受的是 BGR 格式的图片(文档)。

这个错误影响不大,但可能会导致模型对彩色部分检测的准确率下降。