Audio-WestlakeU / NBSS

The official repo of NBC & SpatialNet for multichannel speech separation, denoising, and dereverberation
MIT License
175 stars 21 forks source link

多通道数据集的生成 #8

Open dengyx99 opened 1 year ago

dengyx99 commented 1 year ago

学长您好,请问有用WSJ0生成多通道的脚本嘛?不太清楚这部分要怎么做,在generate_rirs生成房间脉冲响应后,data_loaders里面的代码就不太能对应上了

dengyx99 commented 1 year ago

不知道学长有没有数据生成这一块的说明呢?感觉不太明白数据生成这块为什么要这样写,是不是我房间大小是固定的话,就没有这么多了

quancs commented 1 year ago

学长您好,请问有用WSJ0生成多通道的脚本嘛?不太清楚这部分要怎么做,在generate_rirs生成房间脉冲响应后,data_loaders里面的代码就不太能对应上了

这个位置在生成多通道数据哦。 https://github.com/Audio-WestlakeU/NBSS/blob/549760e35966a629a9bfcf99c9c212aa141b48c8/data_loaders/ss_semi_online_dataset.py#L251

根据readme里面写的方式就可以使用动态生成的多通道信号进行训练了

不知道学长有没有数据生成这一块的说明呢?感觉不太明白数据生成这块为什么要这样写,是不是我房间大小是固定的话,就没有这么多了

房间大小,说话人位置,麦克风位置都是随机生成的

dengyx99 commented 1 year ago

学长有可以直接使用wsj0生成多通道数据集的脚本吗? 因为想得到多通道的数据集,今天测试的时候生成echoic_i特别小,wavfile.write()后波形全是0

quancs commented 1 year ago

学长有可以直接使用wsj0生成多通道数据集的脚本吗?

生成多通道的wsj0,有两步,他们的脚本见对应的py文件: 一、生成房间的RIR:generate_rirs.py 二、生成的RIR卷上wsj0的语音得到多通道语音:见 NBSS/data_loaders/ss_semi_online_dataset.py

因为想得到多通道的数据集,今天测试的时候生成echoic_i特别小,wavfile.write()后波形全是0

我没有遇到过全0的情况。