Gmgge / ImageAnalysisService

轻量模型的图像分析web服务,包括倾斜矫正OCR,公章(印章)检测+识别,车牌识别。api方案使用FastAPI+Gunicorn,提供gradio展示。
61 stars 10 forks source link

公章数据集收集 #2

Open Gmgge opened 8 months ago

Gmgge commented 8 months ago

简介

数据重要性不言而喻,在本任务中,由易到难,我根据公章外形,将公章识别分为多个阶段性任务。

  1. 圆形章识别:本阶段圆形公章识别中,印章名(水平文字部分)识别精度仍然难以有效保证
  2. 三角形章识别:尚未开始
  3. 矩形章识别:尚未开始
  4. 统一模型:支持多种类型印章识别,尚未开始

其中印章数据集有

  1. ICDAR 2023 Competition on Reading the Seal Title
  2. 本项目即将发布的圆形印章数据集,数据来源互联网
  3. 任何其他伙伴分析的数据集

我十分欢迎任何伙伴分享你的真实数据,经过审核后,你将获取当前项目所用到的所有数据集。但是鉴于数据安全问题,可能大家有所顾虑,不过仍然欢迎你们提供识别错误的案例,我将尝试通过数据模拟的方式构造该类型的数据集。

yqj0919 commented 8 months ago

有邮箱么?

yqj0919 commented 8 months ago

可以提供一些印章数据,发你百度网盘链接

Gmgge commented 7 months ago

@yqj0919 本周我尽量更新维护数据共享的事宜,欢迎讨论、共享。

Gmgge commented 7 months ago

本周结束搬家,尽快推进该任务。