TaoRuijie / ECAPA-TDNN

Unofficial reimplementation of ECAPA-TDNN for speaker recognition (EER=0.86 for Vox1_O when train only in Vox2)
MIT License
594 stars 113 forks source link

模型收敛慢 #52

Closed YovRen closed 1 year ago

YovRen commented 1 year ago

学长,我修改了一下代码中的 dataloader 后用模型来训练一个45类的语音语种识别任务,

我想请您帮忙解答几个问题:

TaoRuijie commented 1 year ago

AAMsoftmax的acc不能这么看,请看一下AAMsoftmax的原离和公式,看loss就好了 fc + crossentropy acc会很快 正常

出众不是看分类的training acc的 建议细细看下各个共识的原理和区别“ https://www.bilibili.com/video/BV1tQ4y1i7BR/ 在网络外加,类别数不应该影响模型的embedding shape 训练吗?这。。难回答,但你不应该太关注training acc... training loss重要...

YovRen commented 1 year ago

我去看了一遍视频,理解了acc的问题,但是收敛很慢的问题要怎么解决啊,没思路o(╥﹏╥)o

TaoRuijie commented 1 year ago

这。。我无法解决啊 不好意思

aabbccn commented 6 months ago

我去看了一遍视频,理解了acc的问题,但是收敛很慢的问题要怎么解决啊,没思路o(╥﹏╥)o

  • 设置batch_size=4, lr=0.0001的话是下面的结果
  • 设置batch_size=64, lr=0.001的话是下面的结果

    你好,请问现在解决模型收敛慢的问题了吗,是怎么解决的呢