-
首先很感谢repo主无私的分享,该repo非常经典。在使用该repo过程中走过很多坑以下简要介绍:(1)模型推断阶段BN层未关闭,(2)模型推断时dropout未关闭(但测试了很多,发现未关闭也没有出现影响),(3)模型中图像宽度缩小8倍进入ctc loss计算这一点限制很大,使得你训练使用的图像宽度和图像中的文字序列长度有较好的比例,不然就会导致ctc loss无法计算出现ctc loss
为…
-
## Description
I'm converting a [CRNN+LSTM+CTC](https://github.com/breezedeus/cnocr-models/blob/master/models/cnocr-models-v1.0.0.zip) model to onnx, but get some errors.
converting code:
```
impo…
-
Recent RETURNN:
> RETURNN starting up, version 20200706.123141--git-1bbf93a4, date/time 2020-07-12-09-57-02 (UTC+0200), pid 1594, cwd /work/asr4/zeyer/setups-data/switchboard/2020-06-09--e2e-multi-…
-
你好,请问直接densnet连接ctc和加上lstm再连ctc哪个效果会比较好,作者有试过吗?
如果想加lstm的话,训练代码需要做什么改变吗
-
paddleocr模型能转到1.6.0版本的onnx,且精度没有问题,但1.6.0版本的onnx转rknn遇到了单向双层的lstm算子不支持问题,即使把onnx的选项opset-version设置成11/12也是报出了同样的问题,
```text
W Not match tensor LSTM_LSTM_4:out0
E Try match layer: LSTM_LSTM_4:out0 …
-
一、关于yolov3 文字检测训练的疑问
看了下yolo官网(https://pjreddie.com/darknet/yolo/)的资料,里面提供的是训练识别猫,狗,自行车之类的,这些基本用卷积神经网络提取特征之后就可以识别,训练过程大概是:
准备数据集,主要是标注好的图片xml文件(比如一张图片里面有猫,就用框把猫框住,形成xml文件,当然里面有x,y,w,h这些位置信息),然后就是标…
-
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem
- 系统环境/System Environment:Linux version 3.10.0-514.el7.x86_64 (builder@kbuilder.dev.centos.org) (gcc version…
-
I have built a CRNN model to do OCR on the images containing english words as mentioned in the [link](https://github.com/TheAILearner/A-CRNN-model-for-Text-Recognition-in-Keras/blob/master/CRNN%20Mode…
-
https://arxiv.org/abs/1801.01671
-
您好我是一名初学者,我解压数据图片后训练发现报错显示无法找到图片,我觉得可能是路径问题,请问应该吧数据集放在那里或者在哪个地方修改图像路径的配置