Open BleethNie opened 3 years ago
可以加一个后处理语言模型,进行纠错。
---原始邮件--- 发件人: @.> 发送时间: 2021年4月2日(周五) 下午4:07 收件人: @.>; 抄送: @.***>; 主题: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)
如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化
— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe.
因为我看其它的语音识别是会有一个后处理的语音模型,但是在这个项目里我不太会加,能不能麻烦大神指点一二。
此外,我的一个想法是通过中文纠错,进行后续处理,看看效果如何。
但是有大神指点,我两种方案都会尝试一下
为啥我跑不起来啊大哥
因为我看其它的语音识别是会有一个后处理的语音模型,但是在这个项目里我不太会加,能不能麻烦大神指点一二。
此外,我的一个想法是通过中文纠错,进行后续处理,看看效果如何。
但是有大神指点,我两种方案都会尝试一下
如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化
你好, 请问我可以运行程序,但是为什么识别的一点都不准呢。可以交流一下嘛?谢谢!
您好!是读音正确,字不对吗?
---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:06 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)
因为我看其它的语音识别是会有一个后处理的语音模型,但是在这个项目里我不太会加,能不能麻烦大神指点一二。
此外,我的一个想法是通过中文纠错,进行后续处理,看看效果如何。
但是有大神指点,我两种方案都会尝试一下
如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化
你好, 请问我可以运行程序,但是为什么识别的一点都不准呢。可以交流一下嘛?谢谢!
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。
你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少?
---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)
您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少? … ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4) 您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
识别结果是: 好哎而徽。 手机录的,格式是WAV,我好像知道是哪的问题了,手机录的是48Khz采样频率
你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少? … ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4) 您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
请问您有16Khz采样频率音频的数据集嘛或者推荐录制的软件,我找了半天没找到合适的..感谢!
转一下采样率,可以用ffmpeg
---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:38 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)
你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少? … ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4) 您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
请问您有16Khz采样频率音频的数据集嘛或者推荐录制的软件,我找了半天没找到合适的..感谢!
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
好的,解决了已经,感谢!!
如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化![image](https://user-images.githubusercontent.com/17614992/113395941-429b8800-93cd-11eb-9d34-b38ce9612405.png)