IMM Augmentation Strategy

yeerwen / MedCoSS

CVPR 2024 (Highlight)

Other

90 stars 2 forks source link

感谢你的提问，我们是对mini-batch中N个样本进行打乱。这种方式得到的b_mix会改变文本和图像的语义信息，但也正是我们需要的。对于图像来说，这是一种很常用的增广方式。对于文本来说，虽然不常用，但仍然可以作为一种增广，特别是需要模型具有强泛化能力时。我们这么设计不会造成模型学习紊乱的保证是，我们并不是进行MIM或者MLM的代理任务，而是进行知识蒸馏的操作。

yeerwen / MedCoSS

IMM Augmentation Strategy #6