Open qimingfeijin opened 5 years ago
可以,效果还不错,我使用ICPR2018数据集进行了训练,能够检测出大多数中文字符,对倾斜文字检测效果也不错。
那就好,那我改一改,非常感谢
请问你可以分享给我这个数据集吗
https://pan.baidu.com/s/1NSyc-cHKV3IwDo6qojIrKA 密码: ye9y 我是在huoyijie/AdvancedEAST项目中看到的,自己下载下来试了一下,效果还不错。阿里天池比赛的数据集,主要是一些网络图片。
@qimingfeijin
我用2s的模型检测到的是
论文中的是
有遇到相同的问题吗
@jiaying96 这是ICDAR 2015
@Bachelorwangwei 你好,我用了这个数据集,转化为.tfrecord文件后训练时出现了标签超出边界像素的问题,请问你有遇到吗
@qimingfeijin 转为 tfrecord文件后训练时候出现InvalidArgumentError (see above for traceback): Invalid JPEG data, size 345317,你有遇到过吗
@Bachelorwangwei 您在用ICPR2018数据集进行训练的时候更改train.sh和config.py的参数了吗
@qimingfeijin 我训练的时候也遇到了同样的问题,当时没有处理,可能是由于图片的问题导致的。我的理解是,如果boxes超出了边界,这些图片将不会被用作训练,所以就没有处理。训练了21w步左右,得到的模型预测结果已经很好了,大多数都能正确检测到。 关于具体的这个问题,我参考了 https://github.com/deepthinking-qichao/EAST_ICPR2018 中的方法,这个仓库里面有转换好的数据集,你可以重新下载。或者按照他的方式转换。 ps:但是也会出现少量的超出边界图片。
@jiaying96 参数我都没有修改。按照作者的默认参数执行的。
@jiaying96 训练图片是JPG格式的,程序里可以找到更改的地方
tensorflow.python.framework.errors_impl.InvalidArgumentError: All bounding box coordinates must be in [0.0, 1.0]: -0.00055 @Bachelorwangwei你好,我的报错是这个,请问我该解决这个问题,图片的标签错了的话,我怎么在程序中改让他跳过这个图片呢?
@qimingfeijin 我是按照这个解决的 https://github.com/ZJULearning/pixel_link/issues/7
@qimingfeijin 你有遇到这个问题吗 https://github.com/ZJULearning/pixel_link/issues/115
我有遇到,但是是因为执行时是在这个文件下,根目录就不用写这个文件夹的路径
@Bachelorwangwei 我发现icpr2018与icdar2015坐标点顺序是不一致的,icpr2018是左上点开始,逆时针方向,但icdar2015是左上点开始,顺时针方向,当我调整icpr2018坐标点顺序与icdar一样,训练第十步loss=0,请问您知道原因吗
可以,效果还不错,我使用ICPR2018数据集进行了训练,能够检测出大多数中文字符,对倾斜文字检测效果也不错。
你用icpr2018没有报错decode_jpeg错误么?数据集的图片有些是gif格式的
@Bachelorwangwei 我发现icpr2018与icdar2015坐标点顺序是不一致的,icpr2018是左上点开始,逆时针方向,但icdar2015是左上点开始,顺时针方向,当我调整icpr2018坐标点顺序与icdar一样,训练第十步loss=0,请问您知道原因吗
请问问题解决了么,我训练一开始loss基本在2点几跳动,一开始出现100steps之后loss=nan,我把batch_size设置为16,lr=1e-4,不会出现nan,但是loss仍然在2跳动
我跑了几万步,发现loss现在在1左右徘徊,在1.5左右的时候框是断开的,跑到1左右的时候有部分框可以合起来了,不过仍然速度比较慢。
@qimingfeijin 我用2s的模型检测到的是 论文中的是
有遇到相同的问题吗
我也遇到这个问题你解决了吗?还是重新训练了
有人用这个算法检测中文文本吗,好用吗。我用作者的模型检测中文效果不好,基本检测不到中文。