识别率问题，与词典如何优化问题

BleethNie commented 3 years ago

如下图所示，是我原始内容与识别内容展示，我发现该项目基本可以识别正确读音内容，即声学模型比较好，但是语音模型较差，不知道能不能通过词典或者其它方式进行优化

yang123qwe commented 3 years ago

可以加一个后处理语言模型，进行纠错。

---原始邮件--- 发件人: @.> 发送时间: 2021年4月2日(周五) 下午4:07 收件人: @.>; 抄送: @.***>; 主题: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题，与词典如何优化问题 (#4)

如下图所示，是我原始内容与识别内容展示，我发现该项目基本可以识别正确读音内容，即声学模型比较好，但是语音模型较差，不知道能不能通过词典或者其它方式进行优化

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe.

BleethNie commented 3 years ago

因为我看其它的语音识别是会有一个后处理的语音模型，但是在这个项目里我不太会加，能不能麻烦大神指点一二。

此外，我的一个想法是通过中文纠错，进行后续处理，看看效果如何。

但是有大神指点，我两种方案都会尝试一下

h3clikejava commented 3 years ago

为啥我跑不起来啊大哥

jiukeeeeee commented 2 years ago

因为我看其它的语音识别是会有一个后处理的语音模型，但是在这个项目里我不太会加，能不能麻烦大神指点一二。

此外，我的一个想法是通过中文纠错，进行后续处理，看看效果如何。

但是有大神指点，我两种方案都会尝试一下

如下图所示，是我原始内容与识别内容展示，我发现该项目基本可以识别正确读音内容，即声学模型比较好，但是语音模型较差，不知道能不能通过词典或者其它方式进行优化

你好，请问我可以运行程序，但是为什么识别的一点都不准呢。可以交流一下嘛？谢谢！

yang123qwe commented 2 years ago

您好！是读音正确，字不对吗？

---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:06 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题，与词典如何优化问题 (#4)

因为我看其它的语音识别是会有一个后处理的语音模型，但是在这个项目里我不太会加，能不能麻烦大神指点一二。

此外，我的一个想法是通过中文纠错，进行后续处理，看看效果如何。

但是有大神指点，我两种方案都会尝试一下

如下图所示，是我原始内容与识别内容展示，我发现该项目基本可以识别正确读音内容，即声学模型比较好，但是语音模型较差，不知道能不能通过词典或者其它方式进行优化

你好，请问我可以运行程序，但是为什么识别的一点都不准呢。可以交流一下嘛？谢谢！

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

jiukeeeeee commented 2 years ago

您好，对的！code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来，每一个字都不对。我看上面那个老哥识别的效果还挺好的。

yang123qwe commented 2 years ago

你自己读的，识别结果是什么。存的音频是什么合适，什么设备录音的，采样率多少？

---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题，与词典如何优化问题 (#4)

您好，对的！code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来，每一个字都不对。我看上面那个老哥识别的效果还挺好的。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

jiukeeeeee commented 2 years ago

你自己读的，识别结果是什么。存的音频是什么合适，什么设备录音的，采样率多少？ … ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题，与词典如何优化问题 (#4) 您好，对的！code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来，每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

识别结果是：好哎而徽。手机录的，格式是WAV,我好像知道是哪的问题了，手机录的是48Khz采样频率

jiukeeeeee commented 2 years ago

你自己读的，识别结果是什么。存的音频是什么合适，什么设备录音的，采样率多少？ … ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题，与词典如何优化问题 (#4) 您好，对的！code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来，每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

请问您有16Khz采样频率音频的数据集嘛或者推荐录制的软件，我找了半天没找到合适的..感谢！

yang123qwe commented 2 years ago

转一下采样率，可以用ffmpeg

---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:38 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题，与词典如何优化问题 (#4)

你自己读的，识别结果是什么。存的音频是什么合适，什么设备录音的，采样率多少？ … ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题，与词典如何优化问题 (#4) 您好，对的！code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来，每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

请问您有16Khz采样频率音频的数据集嘛或者推荐录制的软件，我找了半天没找到合适的..感谢！

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

jiukeeeeee commented 2 years ago

好的，解决了已经，感谢！！

yang123qwe / end2end_chinese_speech_recognition

识别率问题，与词典如何优化问题 #4