ArtifexSoftware / pdf2docx

Open source Python library for converting PDF to DOCX.
https://pdf2docx.readthedocs.io
GNU Affero General Public License v3.0
2.46k stars 356 forks source link

转化后存在页面超出的问题 #283

Open cyxxg opened 4 months ago

cyxxg commented 4 months ago

我试了好几个pdf,但都存在页面超出的问题。 比如 原样式 页面超出 这要如何解决呢?可不可以通过设置一个判定,如果文本超过了bbox,就将文字的size缩小呢?文字自动改变大小以适应框的大小,即牺牲文字的样式而保留整体的布局。这是我的一个想法,不知道可不可行。