yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。
Apache License 2.0
597 stars 106 forks source link

online 和offline自己炼的话 相同条件下是不是offline效果好点? #55

Closed 2651084156 closed 1 year ago

yeyupiaoling commented 1 year ago

是你的数据采样率不一样吗?

2651084156 commented 1 year ago

是你的数据采样率不一样吗?

原始数据是44.1k的重采到16k 会有点奇怪不知道为什么 然后这部分从44.1k重采下来的数据确实是测试时候最差的一批emmm

yeyupiaoling commented 1 year ago

的确,跨度这么大,下采样的时候会丢失很多数据

2651084156 commented 1 year ago

那改模型采样率 mel大小要改吗?

2651084156 commented 1 year ago

的确,跨度这么大,下采样的时候会丢失很多数据

对了优化器用AdamW是不是会比Adam好点?

2651084156 commented 1 year ago

对了这东西 图片 抽取规则是怎么样的

yeyupiaoling commented 1 year ago

抽取规则是怎么样的

随机抽取的

yeyupiaoling commented 1 year ago

对了优化器用AdamW是不是会比Adam好点?

我的实验结果是差不多的

2651084156 commented 1 year ago

抽取规则是怎么样的

随机抽取的

图片 感觉这东西抽的全在机械硬盘 ssd一般都可以达到10条

2651084156 commented 1 year ago

对了优化器用AdamW是不是会比Adam好点?

我的实验结果是差不多的

对了为什么不能用Shampoo当优化器看起来这东西好像对TF结构的优化挺好的

yeyupiaoling commented 1 year ago

对了为什么不能用Shampoo当优化器看起来这东西好像对TF结构的优化挺好的

没有这个优化器

2651084156 commented 1 year ago

那个lr是怎么调整的 ?感觉好像越练lr越高

2651084156 commented 1 year ago

图片

2651084156 commented 1 year ago

emmm这lr怎么越来越大了? 图片

2651084156 commented 1 year ago

那个二进制的数据列表怎么根据文本版本的重新生成? 我修改了文本版本的一些数据路径

2651084156 commented 1 year ago

怎么兼容非官方的优化器 发现个提升比较明显的第三方优化器

yeyupiaoling commented 1 year ago

要不你在QQ群上提问吧?