ArtifexSoftware / pdf2docx

Open source Python library for converting PDF to DOCX.
https://pdf2docx.readthedocs.io
GNU Affero General Public License v3.0
2.46k stars 356 forks source link

表格生成的时候没有处理好浮动形图片 #299

Open heweisheng opened 2 months ago

heweisheng commented 2 months ago

研究了下代码,在一开始检测了字体跟图片是否重合,把图片弄成了浮动形的,但是表格里没有合适的格子填充的时候没有处理好 逻辑认为他是表格的一部分,又不给他一个合适的位置,那是否应该变成浮动形去解决这个问题呢? image

image image

heweisheng commented 2 months ago

测试样本

test.pdf