yang123qwe / end2end_chinese_speech_recognition

端到端中文语音识别
84 stars 28 forks source link

识别率问题,与词典如何优化问题 #4

Open BleethNie opened 3 years ago

BleethNie commented 3 years ago

如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化 image

yang123qwe commented 3 years ago

可以加一个后处理语言模型,进行纠错。

---原始邮件--- 发件人: @.> 发送时间: 2021年4月2日(周五) 下午4:07 收件人: @.>; 抄送: @.***>; 主题: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)

如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe.

BleethNie commented 3 years ago

因为我看其它的语音识别是会有一个后处理的语音模型,但是在这个项目里我不太会加,能不能麻烦大神指点一二。

此外,我的一个想法是通过中文纠错,进行后续处理,看看效果如何。

但是有大神指点,我两种方案都会尝试一下

h3clikejava commented 3 years ago

为啥我跑不起来啊大哥

jiukeeeeee commented 2 years ago

因为我看其它的语音识别是会有一个后处理的语音模型,但是在这个项目里我不太会加,能不能麻烦大神指点一二。

此外,我的一个想法是通过中文纠错,进行后续处理,看看效果如何。

但是有大神指点,我两种方案都会尝试一下

如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化 image

你好, 请问我可以运行程序,但是为什么识别的一点都不准呢。可以交流一下嘛?谢谢!

yang123qwe commented 2 years ago

您好!是读音正确,字不对吗?

---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:06 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)

因为我看其它的语音识别是会有一个后处理的语音模型,但是在这个项目里我不太会加,能不能麻烦大神指点一二。

此外,我的一个想法是通过中文纠错,进行后续处理,看看效果如何。

但是有大神指点,我两种方案都会尝试一下

如下图所示,是我原始内容与识别内容展示,我发现该项目基本可以识别正确读音内容,即声学模型比较好,但是语音模型较差,不知道能不能通过词典或者其它方式进行优化

你好, 请问我可以运行程序,但是为什么识别的一点都不准呢。可以交流一下嘛?谢谢!

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

jiukeeeeee commented 2 years ago

您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。

yang123qwe commented 2 years ago

你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少?

---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)

您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

jiukeeeeee commented 2 years ago

你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少? ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4) 您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

识别结果是: 好哎而徽。 手机录的,格式是WAV,我好像知道是哪的问题了,手机录的是48Khz采样频率

jiukeeeeee commented 2 years ago

你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少? ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4) 您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

请问您有16Khz采样频率音频的数据集嘛或者推荐录制的软件,我找了半天没找到合适的..感谢!

yang123qwe commented 2 years ago

转一下采样率,可以用ffmpeg

---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:38 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4)

你自己读的,识别结果是什么。存的音频是什么合适,什么设备录音的,采样率多少? … ---原始邮件--- 发件人: @.> 发送时间: 2022年5月18日(周三) 晚上10:15 收件人: @.>; 抄送: @.@.>; 主题: Re: [yang123qwe/end2end_chinese_speech_recognition] 识别率问题,与词典如何优化问题 (#4) 您好,对的!code自带的那个temp里面的'小宽你好'我自己读了一遍也识别不出来,每一个字都不对。我看上面那个老哥识别的效果还挺好的。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

请问您有16Khz采样频率音频的数据集嘛或者推荐录制的软件,我找了半天没找到合适的..感谢!

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

jiukeeeeee commented 2 years ago

好的,解决了已经,感谢!!