Closed groovy-phazuma closed 1 year ago
SSLで比較に用いたCNNモデルは
GradCamは任意のCNNでgradを逆計算足し合わせしてヒートマップを得ることが可能。 (SSL病理画像で実装したことあり)
月の"シルエット"を認識したい場合、ViTがその性質にあっている 月の"テクスチャ"を認識したい場合、CNNがよさそう。 ヒトの認識性はシルエットによっているので、ViTの方がより直感にはあっている。 参考: https://qiita.com/wakayama_90b/items/e2c9f5e65aec08ffc122
モデルは動かせるようにしつつ、
Model architectures
解釈性
このあたりか 問題なければcloseお願いします。
あざす。確認しました。
実装・ベンチマーク対象とする手法の調査
せっかくなので馴染みがないような手法にも挑戦したい。 ImageNetでの性能: https://paperswithcode.com/sota/image-classification-on-imagenet