which47 / LLMCL

Analyzing and Reducing Catastrophic Forgetting in Parameter Efficient Tuning
19 stars 5 forks source link

EWC的实现问题 #1

Closed deadpool66 closed 2 months ago

deadpool66 commented 6 months ago

我注意到在EWC的代码实现中,对于每个任务计算的是当前任务的fisher。但是根据我对原论文的理解和对其他EWC实现的参考,此处应该计算旧任务的fisher,再应用于当前任务来计算loss。 期待作者的解答。

which47 commented 5 months ago

您好,感谢您提出的问题!我们在每一步结束更新fisher矩阵而不是在每个任务结束后更新,是希望损失函数变化的平缓而不至于导致训练不稳定以及产生的其他问题,我们在编写代码时参考了这个仓库https://github.com/2proveit/TRACE/blob/469d265827c4b1f680d633e32b72b1faa75b1dbd/model/Regular/EWC.py#L123 希望对您有帮助,感谢您的关注