tianchiguaixia / layoutlmv3-chinese

该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作
33 stars 6 forks source link

layoutlmv3 中文表单图片信息抽取

背景

该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题:

数据来源

https://github.com/doc-analysis/XFUND/releases/tag/v1.0 image

图片样例

image

代码结构

├── processing.py     # 数据处理
├── training.py       # 模型训练
├── inference.py       #模型推理

模型训练

image

模型推理效果

1 (5)