支持立体声吗? - Githubissues

yeyupiaoling / PPASR

基于PaddlePaddle实现端到端中文语音识别，从入门到实战，超简单的入门案例，超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型

Apache License 2.0

807 stars 128 forks source link

Closed lonelyxmas closed 2 years ago

lonelyxmas commented 2 years ago

请教一下: 1.支持立体声 2.有支持对话式的语音转文字(带时间戳)?

yeyupiaoling commented 2 years ago

1、立体声会自动转为单通道识别的。 2、你说的带时间戳是什么意思？

lonelyxmas commented 2 years ago

感谢老大回复, 双声道,出来应该是一个两段不同的文字。最终的效果：【客服】【00:00:00】您好【客人】【00:00:03】你好

lonelyxmas commented 2 years ago

【客服】【00:00:00】您好【客人】【00:00:03】你好

yeyupiaoling commented 2 years ago

这种需要你分割再输入得模型中

lonelyxmas commented 2 years ago

这种需要你分割再输入得模型中

感谢，不过不是很理解，初学者，正在研究学习中。

yeyupiaoling commented 2 years ago

我这个模型是一段音频文件只包含一个说话信息的，像你说这样，需要把他们分开成两个音频文件