mcao92 / MobileSCI

Apache License 2.0
5 stars 0 forks source link

请问作者除了原本的MSE损失,论文中还有蒸馏损失在代码中如何体现的呢 #1

Open hopesala opened 2 weeks ago

hopesala commented 2 weeks ago

我看cacti/utils/loss_builder.py,以及配置文件mobile_sci.py均未涉及到教师学生模型的蒸馏损失,请指点迷津,多谢~

image

mcao92 commented 2 weeks ago

Hi,知识蒸馏部分的代码还没有发布。另外,通过图中的公式5可以看出蒸馏的时候是将学生模型和老师模型的输出计算loss。然后和学生模型输出和GT计算出的loss相加得到训练的总loss(公式6)。