印章识别模型训练时，数据标签格式问题？

Gmgge / TrOCR-Seal-Recognition

基于transformer的ocr识别，在公章(印章识别, seal recognition）拓展应用

121 stars 24 forks source link

印章识别模型训练时，数据标签格式问题？ #1

Closed htaoruan closed 8 months ago

htaoruan commented 1 year ago

非常感谢您的分享，我想请教下模型训练时，印章图像对应的标注，直接是整个印章图像和对应的标签吗？印章上是弯曲文本区域，而且会有多个，是当成多行问题解决吗？还是说需要对弯曲文本区域进行多边形标注，再做处理？

Gmgge commented 1 year ago

你好，根据我的实验，基于transformer的trocr，parseq算法，都具有潜在的多行识别能力，例如多行车牌，公章的任务中，只需要将全部图像直接输入，标签方面将多行标签用某些符号替代换行，例如#号。

papersuper commented 1 year ago

非常感谢楼主的分享，请问可以提供一下具体的数据集格式吗，可以提供一下数据标注的具体工具吗

papersuper commented 1 year ago

非常感谢楼主的分享，请问运行onnx模型时出现了这个问题是什么原因呢 onnxruntime.capi.onnxruntime_pybind11_state.InvalidArgument: [ONNXRuntimeError] : 2 : INVALID_ARGUMENT : Unexpected input data type. Actual: (tensor(int32)) , expected: (tensor(int64))

Gmgge commented 11 months ago

@papersuper 很抱歉没有看到，你需要reopen这个问题或者提出新问题我才能第一时间看到这个消息。

数据集格式： 0.png # 图像 0.txt # 标签标签内容南京谐诚机电工程有限公司#审计章其中#作为换行符的替代

运行报错 看样子是数据格式不匹配，能进一步提供报错信息吗？或者你已经解决了问题，欢迎提pr

Gmgge commented 11 months ago

我更新了推理代码，应该修复了该问题，你可以尝试下最新的代码