opendatalab / PDF-Extract-Kit

A Comprehensive Toolkit for High-Quality PDF Content Extraction
GNU Affero General Public License v3.0
4.72k stars 319 forks source link

LayoutLMv3-SFT相比paddleocr的layout模型有何优势? #72

Closed ConleyKong closed 1 month ago

ConleyKong commented 1 month ago

如题,比较好奇LayoutLMv3-SFT相比paddleocr的layout模型有何优势?准确度会更高吗?是否可以直接使用paddle开源的那个layout模型或做进一步训练来减少依赖,甚至整体都切换到onnx模型,加速推理

ConleyKong commented 1 month ago

如题,比较好奇LayoutLMv3-SFT相比paddleocr的layout模型有何优势?准确度会更高吗?是否可以直接使用paddle开源的那个layout模型或做进一步训练来减少依赖,甚至整体都切换到onnx模型,加速推理

我看到源码里面的区分了,lite版本使用的就是paddleocr的layout,full版本使用的才是自训练的模型,厉害了