Open zuowanbushiwo opened 7 months ago
正在训练和测试中。
非常期待,目前在这几个数据集上 看到效果最好的是 MossFormer2
在wsj0上效果还差一点?tf-gridnet 在wsj0上有23.4db?
这个你要参考espnet的复现结果,他们是22左右。图中的结果是sisnr不是sisnri,一般来说sisnri会更高一些。而且这个还没有训练完成。
SPMamba WHAM! Result: SI-SNRi=17.4 dB, SDRi=17.6 dB SPMamba WSJ0-2Mix Result: SI-SNRi=22.5 dB, SDRi=22.7 dB
非常感谢大佬的开源这么棒的项目,挺好奇这个算法在这几个标准的语音分离的效果怎么样?有没有这样大的提升? 谢谢