DayBreak-u / chineseocr_lite

超轻量级中文ocr,支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M
GNU General Public License v2.0
11.72k stars 2.25k forks source link

训练出来的psenet 是25M,和readme中的8.5M差距有点大呀 #149

Open sporterman opened 4 years ago

sporterman commented 4 years ago

@ouyanghuiyu

Debugerss commented 4 years ago

一样,不知道该作者怎么做的,估计做了裁剪,但是不知道怎么做, 然后作者好像也没有给训练模块,不知道如何训练

DayBreak-u commented 4 years ago

你们保存了优化器的参数,所有有25m,最终的模型没那么大

zqnnn commented 4 years ago

请问你是用的psenet文件里的mobilenetv2.py吗,我训练出来的模型怎么有70多M

sporterman commented 4 years ago

你们保存了优化器的参数,所有有25m,最终的模型没那么大

是的 虽然训练出来有25M,但是最终参数只有8.2M, 从大的模型字典里面提取一个key的值保存成模型就可以

sporterman commented 4 years ago

@zqnnn mobilenetv2训练完是25M的

zqnnn commented 4 years ago

谢谢,请问你有使用天池数据集训练psenet吗,天池数据集里标注是小数,而且是逆时针的,需要按照 ICDAR2015格式修改吗

sporterman commented 4 years ago

这个没试过,都是自己标注的数据训练的,天池的数据只是用来刷比赛的,实际项目还是用自己的数据吧

xihananhai commented 4 years ago

@sporterman 你训练的psenet检测模型的效果怎么样,可以达到作者提供的psenet_lite_mbv2.pth的效果吗

Joene-zhou commented 4 years ago

大佬分享一下pse训练代码吗,现在用这个https://github.com/WenmuZhou/PSENet.pytorch训练的模型三百多M