PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
https://paddlepaddle.github.io/PaddleOCR/
Apache License 2.0
41.35k stars 7.57k forks source link

paddleOCR关键信息提取算法SDMGR执行预测时,给出的示例代码必须要带有文本字符标注信息的transcription字段,为啥 #5393

Closed dengxy9527 closed 2 years ago

dengxy9527 commented 2 years ago

(https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/ppstructure/docs/kie.md)

整个文档也没有提供针对一张未标注图片的预测示例 image

LDOUBLEV commented 2 years ago

sdmgr属于KIE,使用的是多模态特征,输入有文本和图像特征;transcription字段是文本信息;

alina-CV commented 2 years ago

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/ppstructure/docs/kie.md#1-%E5%BF%AB%E9%80%9F%E4%BD%BF%E7%94%A8 里面1.txt中的label:1, label:0, 不是说明图片已经做了label关键信息标注吗? 这个时候为什么还要继续用模型呢? 不明白

ChenNima commented 2 years ago

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/ppstructure/docs/kie.md#1-%E5%BF%AB%E9%80%9F%E4%BD%BF%E7%94%A8 里面1.txt中的label:1, label:0, 不是说明图片已经做了label关键信息标注吗? 这个时候为什么还要继续用模型呢? 不明白

1.txt里的label只是满足了模型的输入形状,如果你把1.txt里的label全换成一样的值,还是能正常推理的,推理过程中模型没有看输入的label值。SDMG-R有很多坑我写了一篇文章你可以参考以下 关键信息提取网络SDMG-R代码详解(1): 概览与应用

shallowime commented 1 year ago

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/ppstructure/docs/kie.md#1-%E5%BF%AB%E9%80%9F%E4%BD%BF%E7%94%A8 里面1.txt中的label:1, label:0, 不是说明图片已经做了label关键信息标注吗? 这个时候为什么还要继续用模型呢? 不明白

1.txt里的label只是满足了模型的输入形状,如果你把1.txt里的label全换成一样的值,还是能正常推理的,推理过程中模型没有看输入的label值。SDMG-R有很多坑我写了一篇文章你可以参考以下 关键信息提取网络SDMG-R代码详解(1): 概览与应用

感谢感谢,这个文章解决了我全部的问题,建议其他有问题的朋友也参考这篇!