MediaBrain-SJTU / MVFA-AD

[CVPR2024 Highlight] Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images
MIT License
110 stars 16 forks source link

与VAND中的工作的区别 #2

Closed leejq666 closed 5 months ago

leejq666 commented 5 months ago

您好!您这篇工作在AS训练过程中使用了像素级注释,但是VAND中的工作如 April-GAN 貌似没有使用像素级注释?

chaoqinhuang commented 5 months ago

April-GAN在VAND比赛中,使用的是MVTec AD的像素级注释进行训练 在我们论文的实验中,我们调整April-GAN的训练数据,使其与我们的方法使用的训练数据对齐

leejq666 commented 5 months ago

okok非常感谢您的回复

leejq666 commented 5 months ago

还有就是公式4的softmax后面使用的是叉乘还是点乘?相乘以后的特征维数与Fcls或者Fseg在与文本特征进行比较前的特征维数一样吗

chaoqinhuang commented 5 months ago

矩阵叉乘,结果是一个G*2的矩阵

leejq666 commented 5 months ago

谢谢,了解了!