opendatalab / PDF-Extract-Kit

A Comprehensive Toolkit for High-Quality PDF Content Extraction
https://pdf-extract-kit.readthedocs.io/zh-cn/latest/index.html
GNU Affero General Public License v3.0
5.27k stars 357 forks source link

LayoutLMv3-SFT相比paddleocr的layout模型有何优势? #72

Closed ConleyKong closed 3 months ago

ConleyKong commented 3 months ago

如题,比较好奇LayoutLMv3-SFT相比paddleocr的layout模型有何优势?准确度会更高吗?是否可以直接使用paddle开源的那个layout模型或做进一步训练来减少依赖,甚至整体都切换到onnx模型,加速推理

ConleyKong commented 3 months ago

如题,比较好奇LayoutLMv3-SFT相比paddleocr的layout模型有何优势?准确度会更高吗?是否可以直接使用paddle开源的那个layout模型或做进一步训练来减少依赖,甚至整体都切换到onnx模型,加速推理

我看到源码里面的区分了,lite版本使用的就是paddleocr的layout,full版本使用的才是自训练的模型,厉害了