online 和offline自己炼的话相同条件下是不是offline效果好点？

yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架，同时兼容在线和离线识别，目前支持Conformer、Squeezeformer、DeepSpeech2模型，支持多种数据增强方法。

Apache License 2.0

597 stars 106 forks source link

Closed 2651084156 closed 1 year ago

yeyupiaoling commented 1 year ago

是你的数据采样率不一样吗？

2651084156 commented 1 year ago

是你的数据采样率不一样吗？

原始数据是44.1k的重采到16k 会有点奇怪不知道为什么然后这部分从44.1k重采下来的数据确实是测试时候最差的一批emmm

yeyupiaoling commented 1 year ago

的确，跨度这么大，下采样的时候会丢失很多数据

2651084156 commented 1 year ago

那改模型采样率 mel大小要改吗？

2651084156 commented 1 year ago

的确，跨度这么大，下采样的时候会丢失很多数据

对了优化器用AdamW是不是会比Adam好点？

2651084156 commented 1 year ago

对了这东西抽取规则是怎么样的

yeyupiaoling commented 1 year ago

抽取规则是怎么样的

随机抽取的

yeyupiaoling commented 1 year ago

对了优化器用AdamW是不是会比Adam好点？

我的实验结果是差不多的

2651084156 commented 1 year ago

抽取规则是怎么样的

随机抽取的

感觉这东西抽的全在机械硬盘 ssd一般都可以达到10条

2651084156 commented 1 year ago

对了优化器用AdamW是不是会比Adam好点？

我的实验结果是差不多的

对了为什么不能用Shampoo当优化器看起来这东西好像对TF结构的优化挺好的

yeyupiaoling commented 1 year ago

对了为什么不能用Shampoo当优化器看起来这东西好像对TF结构的优化挺好的

没有这个优化器

2651084156 commented 1 year ago

那个lr是怎么调整的？感觉好像越练lr越高

2651084156 commented 1 year ago

emmm这lr怎么越来越大了？

2651084156 commented 1 year ago

那个二进制的数据列表怎么根据文本版本的重新生成？我修改了文本版本的一些数据路径

2651084156 commented 1 year ago

怎么兼容非官方的优化器发现个提升比较明显的第三方优化器

yeyupiaoling commented 1 year ago

要不你在QQ群上提问吧？