paddleOCR关键信息提取算法SDMGR执行预测时，给出的示例代码必须要带有文本字符标注信息的transcription字段，为啥

PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

https://paddlepaddle.github.io/PaddleOCR/

Apache License 2.0

41.35k stars 7.57k forks source link

paddleOCR关键信息提取算法SDMGR执行预测时，给出的示例代码必须要带有文本字符标注信息的transcription字段，为啥 #5393

Closed dengxy9527 closed 2 years ago

dengxy9527 commented 2 years ago

(https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/ppstructure/docs/kie.md)

整个文档也没有提供针对一张未标注图片的预测示例

LDOUBLEV commented 2 years ago

sdmgr属于KIE，使用的是多模态特征，输入有文本和图像特征；transcription字段是文本信息；

alina-CV commented 2 years ago

那 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/ppstructure/docs/kie.md#1-%E5%BF%AB%E9%80%9F%E4%BD%BF%E7%94%A8 里面1.txt中的label:1, label:0, 不是说明图片已经做了label关键信息标注吗？这个时候为什么还要继续用模型呢？不明白

ChenNima commented 2 years ago

那 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/ppstructure/docs/kie.md#1-%E5%BF%AB%E9%80%9F%E4%BD%BF%E7%94%A8 里面1.txt中的label:1, label:0, 不是说明图片已经做了label关键信息标注吗？这个时候为什么还要继续用模型呢？不明白

1.txt里的label只是满足了模型的输入形状，如果你把1.txt里的label全换成一样的值，还是能正常推理的，推理过程中模型没有看输入的label值。SDMG-R有很多坑我写了一篇文章你可以参考以下关键信息提取网络SDMG-R代码详解(1): 概览与应用

shallowime commented 1 year ago

那 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/ppstructure/docs/kie.md#1-%E5%BF%AB%E9%80%9F%E4%BD%BF%E7%94%A8 里面1.txt中的label:1, label:0, 不是说明图片已经做了label关键信息标注吗？这个时候为什么还要继续用模型呢？不明白

1.txt里的label只是满足了模型的输入形状，如果你把1.txt里的label全换成一样的值，还是能正常推理的，推理过程中模型没有看输入的label值。SDMG-R有很多坑我写了一篇文章你可以参考以下关键信息提取网络SDMG-R代码详解(1): 概览与应用

感谢感谢，这个文章解决了我全部的问题，建议其他有问题的朋友也参考这篇！