yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。
Apache License 2.0
596 stars 106 forks source link

流式语音识别的功能貌似没有看到,请问现今实现了么? #29

Closed RabbitBoss closed 2 years ago

yeyupiaoling commented 2 years ago

模型是支持流式的,有一个小例子,在infer_path.py

RabbitBoss commented 2 years ago

看到了,不过我在测试新的样例时,短句时是好使的,但是切换成流式时没有输出

yeyupiaoling commented 2 years ago

最终也没有结果?

RabbitBoss commented 2 years ago

未分段

消耗时间:1287ms, 识别结果: 今天我给我的女儿要岁钱但是我不让别人给他压岁钱而是改用压岁输, 得分: 89

分段


分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:18ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:19ms, 识别结果: , 得分: 0 分段结果:消耗时间:22ms, 识别结果: , 得分: 0 分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:14ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:14ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:18ms, 识别结果: , 得分: 0 分段结果:消耗时间:16ms, 识别结果: , 得分: 0 分段结果:消耗时间:15ms, 识别结果: , 得分: 0 分段结果:消耗时间:7ms, 识别结果: , 得分: 0 整一句结果:消耗时间:339ms, 识别结果: , 得分: 0

yeyupiaoling commented 2 years ago

这个不应该啊,分段最后的输出应该跟不分段输出是一样才对。