yeyupiaoling / PPASR

基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型
Apache License 2.0
807 stars 128 forks source link

支持立体声吗? #52

Closed lonelyxmas closed 2 years ago

lonelyxmas commented 2 years ago

请教一下: 1.支持立体声 2.有支持对话式的语音转文字(带时间戳)?

yeyupiaoling commented 2 years ago

1、立体声会自动转为单通道识别的。 2、你说的带时间戳是什么意思?

lonelyxmas commented 2 years ago

感谢老大回复, 双声道,出来应该是一个两段不同的文字。 最终的效果: 【客服】【00:00:00】 您好 【客人】【00:00:03】你好

lonelyxmas commented 2 years ago

【客服】【00:00:00】 您好 【客人】【00:00:03】你好

yeyupiaoling commented 2 years ago

这种需要你分割再输入得模型中

lonelyxmas commented 2 years ago

这种需要你分割再输入得模型中

感谢, 不过不是很理解,初学者,正在研究学习中。

yeyupiaoling commented 2 years ago

我这个模型是一段音频文件只包含一个说话信息的,像你说这样,需要把他们分开成两个音频文件