Le-Xiaohuai-speech / DPCRN_DNS3

Implementation of paper "DPCRN: Dual-Path Convolution Recurrent Network for Single Channel Speech Enhancement"
188 stars 41 forks source link

你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗? #20

Open Helen0804 opened 2 years ago

Helen0804 commented 2 years ago

你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗?默认是win_length=400, hop_length=200。

Le-Xiaohuai-speech commented 2 years ago

直接把音频升采样到16是个解决办法。用原始的参数也行,但是时延在8k下面变成两倍

---原始邮件--- 发件人: @.> 发送时间: 2022年5月23日(周一) 上午9:14 收件人: @.>; 抄送: @.***>; 主题: [Le-Xiaohuai-speech/DPCRN_DNS3] 你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗? (Issue #20)

你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗?默认是win_length=400, hop_length=200。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

Helen0804 commented 2 years ago

好的,谢谢。

BruceLz commented 2 years ago

您好,看到采样率不一样的数据可以重采样为DSN数据集的音频采样率(16k)再处理,想问一下不同位深的数据对训练有影响吗?因为看到数据集都是16位,发现自己采集的数据集是24位。

Le-Xiaohuai-speech commented 2 years ago

可忽略不计,因为输入的音频都是float32

---原始邮件--- 发件人: @.> 发送时间: 2022年6月8日(周三) 晚上7:21 收件人: @.>; 抄送: @.**@.>; 主题: Re: [Le-Xiaohuai-speech/DPCRN_DNS3] 你好,使用采样率为8K的音频数据训练,win_length, hop_length等参数需要修改吗? (Issue #20)

您好,看到采样率不一样的数据可以重采样为DSN数据集的音频采样率(16k)再处理,想问一下不同位深的数据对训练有影响吗?因为看到数据集都是16位,发现自己采集的数据集是24位。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>