JusperLee / SPMamba

Apache License 2.0
130 stars 16 forks source link

请问有在wsj0-mix, wham 和 WHAMR 这样标准实验集上做过实验吗? #5

Open zuowanbushiwo opened 7 months ago

zuowanbushiwo commented 7 months ago

非常感谢大佬的开源这么棒的项目,挺好奇这个算法在这几个标准的语音分离的效果怎么样?有没有这样大的提升? 谢谢

JusperLee commented 7 months ago

正在训练和测试中。

zuowanbushiwo commented 7 months ago

非常期待,目前在这几个数据集上 看到效果最好的是 MossFormer2 image

image

JusperLee commented 7 months ago

https://github.com/JusperLee/SPMamba/blob/main/README.md#wsj0

zuowanbushiwo commented 7 months ago

在wsj0上效果还差一点?tf-gridnet 在wsj0上有23.4db?

JusperLee commented 7 months ago

这个你要参考espnet的复现结果,他们是22左右。图中的结果是sisnr不是sisnri,一般来说sisnri会更高一些。而且这个还没有训练完成。

JusperLee commented 6 months ago

SPMamba WHAM! Result: SI-SNRi=17.4 dB, SDRi=17.6 dB SPMamba WSJ0-2Mix Result: SI-SNRi=22.5 dB, SDRi=22.7 dB