Open zhangyu1025431817 opened 4 years ago
识别率应该完全相同,您有什么问题?
如果我代码里面这样写 rec = new KaldiRecognizer(activityReference.get().model, 16000.f,"打开 十 区 八 列"); 识别wav文件的时候能很精确的识别出来,可是我通过麦克风说这些的时候识别结果差距很大,请问是我需要在哪里自定义词汇么?或者是我的麦克风的采样率不一样导致的么?我修改了采样率好像还是一样。
你需要这个拉请求 https://github.com/alphacep/vosk-api/pull/109 它尚未集成 我将整合并让您知道
thank you very much
请问,如果我想识别多个控制指令,grammer我用空格分开输入多个,类似“打开 关闭 一 二 区 ”这种,偶尔会有 W/VoskAPI: OutputArcForce():word-align-lattice.cc:578) Invalid word at end of lattice [partial lattice, forced out?]的提示,并且内存会暴增,程序crash掉,是我grammer格式有问题么
词典中缺少一些单词。 稍后,我将不得不对此添加一些更详细的警告。
能添加唤醒词么?我想让他唤醒以后再响应我的指令
它将很快得到支持。 在 https://github.com/alphacep/vosk-api/issues/107 上订阅
能添加唤醒词么?我想让他唤醒以后再响应我的指令
其实唤醒词,我这做了。我是设置了状态机,唤醒词是一直监听。识别唤醒词后,进入响应指令状态。一定时间没有指令后,自动进入待唤醒状态。 我个人认为想要实现唤醒词,只是代码逻辑上做文章就可以了。
@JiaDeng-Git 你好 请问你可否分享的你项目代码?你用什么package去detect唤醒词?
您好,请问通过麦克风实时翻译,如何做到跟demo里面识别wav格式文件一样的识别率?