PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
https://paddlepaddle.github.io/PaddleOCR/
Apache License 2.0
42.44k stars 7.66k forks source link

弯曲印章数据集生成 #8018

Closed xialei2821212670 closed 1 year ago

xialei2821212670 commented 1 year ago

标注的是16个点的坐标,文字内容不好切分出来构建数据集。db++,检测出来的弯曲文本框,改如何让svrt,进行识别。get_rotate_crop_image()这边也是裁剪的,4坐标点。

xialei2821212670 commented 1 year ago

image ,我将数据集标注的文字区域提取出来,进行训练。对这种弯曲过大的,完全不行,是需要进行后处理? image image

log.txt 采用的训练参数

phb-shiyige-fw commented 1 year ago

你好 想请问一下您是如何将数据集中的弯曲文本截取出来的?我看md中有图片裁剪代码,但是属于四点坐标的截取,没办法实现弯曲文本的图像裁剪,请问可以提供相关的截取代码吗?感激不尽

LDOUBLEV commented 1 year ago

改如何让svrt

在SVTR中有STN,支持弯曲的文字识别

shallow10 commented 1 month ago

有偿提供解决弯曲文本方面的数据集等代码问题