yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。
Apache License 2.0
563 stars 100 forks source link

remove x_len #46

Closed moneypi closed 1 year ago

moneypi commented 1 year ago

因为我觉得,x_len始终可以从x.shape中获得,无须单独手动去计算,或传参,相关的代码可以进行一些简化,供参考

yeyupiaoling commented 1 year ago

不可以的,这里输入得是音频的实际长度,如下,长度应该是[3, 2, 5],如果只从x取,那就是5,不能确保是每一条的实际长度。

[[1, 2, 3, 0, 0],
  [1, 2, 0, 0, 0],
  [1, 2, 3, 4, 5]]