RapidAI / RapidOCRPDF

Based on RapidOCR, extract the PDF content.
Apache License 2.0
131 stars 14 forks source link

版式还原 #1

Closed BrightXiaoHan closed 2 months ago

BrightXiaoHan commented 1 year ago

请问会更新版式还原功能么

SWHL commented 1 year ago

如果是可以直接复制的PDF,请直接使用pdf2docx 如果是扫描版的PDF,后续会更新的,时间不定哈

Littleweisheit commented 1 year ago

这要做出来了,就不用看扫描版的了。

SWHL commented 1 year ago

实际上,结合RapidStructure中已有的功能块,已经可以做的。 感兴趣的小伙伴,可以自己尝试尝试

pjhcsz commented 9 months ago

我在centos7上安装了,运行的时候一直报错:Exception ignored in: <function Document.del at 0x000001607F39EF70> AttributeError: 'Document' object has no attribute 'is_closed',然后我安装了fitz库,还是不行,求大神解答

SWHL commented 9 months ago

@pjhcsz 在新的issue里说吧,当前issue和你的问题关系不大哈 新issue #9

SWHL commented 2 months ago

参见最新项目:https://github.com/RapidAI/RapidLayoutRecover