alphacep / vosk-api

Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
Apache License 2.0
7.92k stars 1.1k forks source link

kaldi中librispeech 下chain 和 aishell下chain 加载vosk #491

Open tuocheng0824 opened 3 years ago

tuocheng0824 commented 3 years ago

各位好: 我再问一个问题,kaldi中aishell下面的chain训练语音识别的代码和 librispeech下面 chain的框架不一样 一个是tdnn ,一个是tdnnf 然后librispeech会加载出来,aishell会因为维度报错,所以想问问你们那边是否是同样的问题?

nshmyrev commented 3 years ago

tdnnf比tdnn更近,更先进 链接

两者都应该加载良好。

请提供有关错误消息的更多详细信息。

tuocheng0824 commented 3 years ago

你好:

那里面的维度,参数不同,会有影响吗,我同事用kaldi 下 nnet3/chain 训练中文语音识别出来,然后我这边用vosk 进行加载,报了一个维度问题, input feature dimension mismatch got 40 but network expects 43,请问vosk对中文语音识别会出现这样的问题是吗?

nshmyrev commented 3 years ago

此错误表明模型已经使用音高特征进行了训练。 您需要在model文件夹中创建一个文件pitch.conf来加载模型。

有关详细信息,请参见https://github.com/alphacep/vosk-api/issues/442

tuocheng0824 commented 3 years ago

你好: 那里面的维度,参数不同,会有影响吗,我同事用kaldi 下 nnet3/chain 训练中文语音识别出来,然后我这边用vosk 进行加载,报了一个维度问题, input feature dimension mismatch got 40 but network expects 43,请问vosk对中文语音识别会出现这样的问题是吗?