多通道数据集的生成

Audio-WestlakeU / NBSS

The official repo of NBC & SpatialNet for multichannel speech separation, denoising, and dereverberation

MIT License

175 stars 21 forks source link

Open dengyx99 opened 1 year ago

dengyx99 commented 1 year ago

学长您好，请问有用WSJ0生成多通道的脚本嘛？不太清楚这部分要怎么做，在generate_rirs生成房间脉冲响应后，data_loaders里面的代码就不太能对应上了

dengyx99 commented 1 year ago

不知道学长有没有数据生成这一块的说明呢？感觉不太明白数据生成这块为什么要这样写，是不是我房间大小是固定的话，就没有这么多了

quancs commented 1 year ago

学长您好，请问有用WSJ0生成多通道的脚本嘛？不太清楚这部分要怎么做，在generate_rirs生成房间脉冲响应后，data_loaders里面的代码就不太能对应上了

根据readme里面写的方式就可以使用动态生成的多通道信号进行训练了

不知道学长有没有数据生成这一块的说明呢？感觉不太明白数据生成这块为什么要这样写，是不是我房间大小是固定的话，就没有这么多了

房间大小，说话人位置，麦克风位置都是随机生成的

dengyx99 commented 1 year ago

学长有可以直接使用wsj0生成多通道数据集的脚本吗？因为想得到多通道的数据集，今天测试的时候生成echoic_i特别小，wavfile.write()后波形全是0

quancs commented 1 year ago

学长有可以直接使用wsj0生成多通道数据集的脚本吗？

生成多通道的wsj0，有两步，他们的脚本见对应的py文件：一、生成房间的RIR：generate_rirs.py 二、生成的RIR卷上wsj0的语音得到多通道语音：见 NBSS/data_loaders/ss_semi_online_dataset.py

因为想得到多通道的数据集，今天测试的时候生成echoic_i特别小，wavfile.write()后波形全是0

我没有遇到过全0的情况。