Byaidu / PDFMathTranslate

PDF scientific paper translation and bilingual comparison based on font rules and deep learning, preserving formula and figure layout
MIT License
67 stars 10 forks source link

在翻译几百页的英文图书时,输出的翻译内容仅翻译了前几页的内容,后面都还是英文 #8

Open oisin9 opened 8 hours ago

oisin9 commented 8 hours ago

系统环境: 系统:windows11 23H2 CPU: amd 5700G GPU: 4060Ti pdf2zh版本:pdf2zh v1.4.9 安装方式:pip安装

使用下面的命令来翻译:

pdf2zh.exe '.\Algorithms Jeff Erickson.pdf'

输出的内容只有前几页是翻译后的中文,其余还是英文内容。

文件如下: Algorithms Jeff Erickson.pdf

oisin9 commented 8 hours ago

加上-d参数后,发现只有前几页是正常的,后面的输出内容都是空的,如下:

EBUG:pdf2zh.converter:
==========[VSTACK]==========

DEBUG:pdf2zh.converter:
==========[SSTACK]==========

  2%|█▎                                                           | 11/514 [00:03<02:18,  3.64it/s]DEBUG:pdf2zh.converter:
==========[VSTACK]==========

DEBUG:pdf2zh.converter:
==========[SSTACK]==========

  2%|█▍                                                           | 12/514 [00:03<02:11,  3.81it/s]DEBUG:pdf2zh.converter:
==========[VSTACK]==========

DEBUG:pdf2zh.converter:
==========[SSTACK]==========

  3%|█▌                                                           | 13/514 [00:03<02:07,  3.94it/s]DEBUG:pdf2zh.converter:
Byaidu commented 6 hours ago

好像有点难处理了,这个文档里的正文部分是 Form 套娃结构而不是正常的 Page

Byaidu commented 1 hour ago

解决了