breezedeus / CnOCR

CnOCR: Awesome Chinese/English OCR Python toolkits based on PyTorch. It comes with 20+ well-trained models for different application scenarios and can be used directly after installation. 【基于 PyTorch/MXNet 的中文/英文 OCR Python 包。】
https://www.breezedeus.com/article/cnocr
Apache License 2.0
3.19k stars 498 forks source link

微调效果很差 #317

Closed pujianjian closed 2 weeks ago

pujianjian commented 6 months ago

你好,我想微调训练让模型对μ的识别更好,发现微调之后模型乱识别,效果巨差,不知道是什么原因? 我微调的图片只有μm,然后图片比较小,标签就是 ****.jpg μ m 如果可以帮忙解答将感激不尽

breezedeus commented 6 months ago

多少图片

pujianjian commented 6 months ago

三百多张,文字很单一

pujianjian commented 6 months ago

因为μ这个识别效果不好,我这边想优化一下这个,数据集这样制作应该是正确的吧 微信图片_20240307174811

breezedeus commented 6 months ago

格式是没问题的。不过你这不会就是一张图吧

pujianjian commented 6 months ago

有三百多张这样的图,图也基本长一样,因为我们检测都是这样的