Open Helen0804 opened 2 years ago
直接把音频升采样到16是个解决办法。用原始的参数也行,但是时延在8k下面变成两倍
---原始邮件--- 发件人: @.> 发送时间: 2022年5月23日(周一) 上午9:14 收件人: @.>; 抄送: @.***>; 主题: [Le-Xiaohuai-speech/DPCRN_DNS3] 你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗? (Issue #20)
你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗?默认是win_length=400, hop_length=200。
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>
好的,谢谢。
您好,看到采样率不一样的数据可以重采样为DSN数据集的音频采样率(16k)再处理,想问一下不同位深的数据对训练有影响吗?因为看到数据集都是16位,发现自己采集的数据集是24位。
可忽略不计,因为输入的音频都是float32
---原始邮件--- 发件人: @.> 发送时间: 2022年6月8日(周三) 晚上7:21 收件人: @.>; 抄送: @.**@.>; 主题: Re: [Le-Xiaohuai-speech/DPCRN_DNS3] 你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗? (Issue #20)
您好,看到采样率不一样的数据可以重采样为DSN数据集的音频采样率(16k)再处理,想问一下不同位深的数据对训练有影响吗?因为看到数据集都是16位,发现自己采集的数据集是24位。
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗?默认是win_length=400, hop_length=200。