384863451 / invoice_ocr

混合票据识别,增值税专用发票, 增值税普通发票, 增值税电子专用发票, 增值税电子普通发票, 增值税普通发票(卷式), 非税财政电子票据, 过路费发票, 火车票, 飞机票, 客运票, 出租车票, 定额, 通用机打发票
99 stars 41 forks source link

混合报销票据识别

识别文件类型:图片,pdf,ofd, 0,90,180,270四种度数。 识别类型:增值税专用发票, 增值税普通发票, 增值税电子专用发票, 增值税电子普通发票, 增值税普通发票(卷式), 过路费发票, 火车票, 飞机票, 客运票, 出租车票, 定额, 通用机打发票

环境

  1. python3.5/3.6
  2. 依赖项安装:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  3. 有GPU环境的可修改安装requirements.txt对应版本的tensorflow-gpu,config.py文件中控制GPU的开关

    模型架构

    YOLOv5 + CRNN + CTC

模型

  1. 模型下载地址:链接:链接:https://pan.baidu.com/s/1E_OE9HOjjFh6GZdPWQVbMg 提取码:voqi
  2. 将下载完毕的模型文件夹models放置于项目根目录下

    服务启动

  3. 控制台 python manage.py runserver 127.0.0.1:8080
  4. 端口可自行修改
  5. 服务调用地址:http://...: [端口号]/detection_images,http://127.0.0.1:8080/detection,例:http://127.0.0.1:8080/detection_images

测试demo

  1. 测试工具:postman,可自行下载安装
  2. 4张增值税发票混拍

Image text

代码执行过程说明

后期开发计划

参考

chineseocr https://github.com/chineseocr/chineseocr

总结

新手做着玩,代码写的很乱。