JusperLee / Dual-Path-RNN-Pytorch

Dual-path RNN: efficient long sequence modeling for time-domain single-channel speech separation implemented by Pytorch
Apache License 2.0
417 stars 65 forks source link

DPRNN batch size #46

Open ZhangYu-x opened 2 years ago

ZhangYu-x commented 2 years ago

您好,我看到您的知乎分享贴中说DPRNN好像一个batch size效果最好, 您试过batch size等于2或者更高的时候吗,您在代码的readme中说100个epoch之后DPRNN的sisnr能到达18.98dB,那batch size = 2的时候sisnr能到达多少您记得吗?因为batchsize=1训练起来非常慢,我想试试batch size=2的时候,但是不知道能获得什么效果。

JusperLee commented 2 years ago

没有试过,因为我的显存不支持batch=2。您可以尝试一下,可能没有什么问题

ZhangYu-x commented 2 years ago

没有试过,因为我的显存不支持batch=2。您可以尝试一下,可能没有什么问题

sisnr=18.98dB是您在这套DPRNN代码上跑出来的吗,我想确认一下是不是我参数配置的问题,因为我用您的代码最终没能跑到18.98dB。

JusperLee commented 2 years ago

没有试过,因为我的显存不支持batch=2。您可以尝试一下,可能没有什么问题

sisnr=18.98dB是您在这套DPRNN代码上跑出来的吗,我想确认一下是不是我参数配置的问题,因为我用您的代码最终没能跑到18.98dB。

是在这个代码中跑出来的。

ZhangYu-x commented 2 years ago

您的超参数设置和论文里面的参数设置一样吗,我不太明白为什么一样的代码,数据集也是WSJ0-2mix,我跑了50个epoch之后才达到15dB。是RNN模型训练结果有很大的随机性吗?

JusperLee commented 2 years ago

https://github.com/JusperLee/Dual-Path-RNN-Pytorch/blob/520ff8d2111bd19a54e5f3b7bde148d80b1eafdb/config/Dual_RNN/train_rnn.yml#L33 这个换成gLN

ZhangYu-x commented 2 years ago

https://github.com/JusperLee/Dual-Path-RNN-Pytorch/blob/520ff8d2111bd19a54e5f3b7bde148d80b1eafdb/config/Dual_RNN/train_rnn.yml#L33

这个换成gLN

好的,谢谢您,我试一试。