JusperLee / SPMamba

Apache License 2.0
121 stars 15 forks source link

实例化SPMamba.py #4

Open SmoothJing opened 6 months ago

SmoothJing commented 6 months ago

李凯前辈您好: 我从事的不是语音分离方向,所以有些东西还不太懂,但是我很关注mamba在语音方向上的应用,特别是在语音分离方向的卓越性能,想通过您这篇代码学习一下,所以就去调通了代码,我想实例化一下SPMamba.py主模块,但是由于语音分离方向和我现在的方向有些差别,所以想寻求一下前辈的帮助,希望得到前辈的解答,感谢!!!

JusperLee commented 6 months ago

什么意思,你可以单独将其拿出

SmoothJing commented 6 months ago

前辈,我想我已经解决了这个问题,mamba-ssm包里面有不适配的东西,RMSNorm接受了一个没有被定义的参数,我想向您请教下,因为RMSNorm本质上是一个归一化,我想把他替换为LN,不知道前辈做过类似的实验没,影响不知道大不大。 代码如下 class MambaBlock(nn.Module): def init(self, in_channels, n_layer=1, bidirectional=False): super(MambaBlock, self).init() self.forward_blocks = nn.ModuleList([]) for i in range(n_layer): self.forward_blocks.append( Block( in_channels, mixer_cls=partial(Mamba, layer_idx=i, d_state=16, d_conv=4, expand=4),

norm_cls=partial(RMSNorm, eps=1e-5),

                fused_add_norm=False,
            )
        )
JusperLee commented 6 months ago

按理说在这个任务上并不影响