Closed kaixinbaba closed 3 years ago
对不起我又来提问了。
第二个125的公式 是经过计算的吗?就是512宽度经过卷积缩小后的 长度?还是凑巧 都是125?
另一个问题是 这个125 可以是别的数字吗?如果要改成别的数字的话 是两个地方还是要保持一致吗?(比如减少最大长度512,然后再经过计算得到一个新的值)
有这些疑问是因为 我想要把 您的pytorch实现自己通过mxnet重新实现一下,但是发现mxnet的CTCLoss的入参要求不太一样, 调了一会 不知道怎么修改,得到的loss非常奇怪,要么非常小 要么非常大 其他地方感觉差的不多,就是这个loss的应用 所以就想把您的实现搞清楚点,就碰到了上面的疑问,希望能得到您的回复 谢谢
@kaixinbaba 您好, a) crnn 网络,输入宽度512经过两个pooling,变为512/4=128; 后面经过两个2*2的pooling,但是在宽度上的步长是1,那么128需要减2,最后又有一个没有padding的卷积,再减1,128-3就变为125了。 b) 宽度可以改为其它的值,最后计算方式还是self.im_w // 4 - 3
谢谢您的耐心回复
对不起我又来提问了。
第二个125的公式 是经过计算的吗?就是512宽度经过卷积缩小后的 长度?还是凑巧 都是125?
另一个问题是 这个125 可以是别的数字吗?如果要改成别的数字的话 是两个地方还是要保持一致吗?(比如减少最大长度512,然后再经过计算得到一个新的值)
有这些疑问是因为 我想要把 您的pytorch实现自己通过mxnet重新实现一下,但是发现mxnet的CTCLoss的入参要求不太一样, 调了一会 不知道怎么修改,得到的loss非常奇怪,要么非常小 要么非常大 其他地方感觉差的不多,就是这个loss的应用 所以就想把您的实现搞清楚点,就碰到了上面的疑问,希望能得到您的回复 谢谢