与VAND中的工作的区别

MediaBrain-SJTU / MVFA-AD

[CVPR2024 Highlight] Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images

MIT License

110 stars 16 forks source link

Closed leejq666 closed 5 months ago

leejq666 commented 5 months ago

您好！您这篇工作在AS训练过程中使用了像素级注释，但是VAND中的工作如 April-GAN 貌似没有使用像素级注释？

chaoqinhuang commented 5 months ago

April-GAN在VAND比赛中，使用的是MVTec AD的像素级注释进行训练在我们论文的实验中，我们调整April-GAN的训练数据，使其与我们的方法使用的训练数据对齐

leejq666 commented 5 months ago

okok非常感谢您的回复

leejq666 commented 5 months ago

还有就是公式4的softmax后面使用的是叉乘还是点乘？相乘以后的特征维数与Fcls或者Fseg在与文本特征进行比较前的特征维数一样吗

chaoqinhuang commented 5 months ago

矩阵叉乘，结果是一个G*2的矩阵

leejq666 commented 5 months ago

谢谢，了解了！