groovy-phazuma / Moon_Pattern_Inference

月面の模様から動物や人の表情を予測する
MIT License
1 stars 0 forks source link

Survey for classification models #6

Closed groovy-phazuma closed 9 months ago

groovy-phazuma commented 9 months ago

実装・ベンチマーク対象とする手法の調査

せっかくなので馴染みがないような手法にも挑戦したい。 ImageNetでの性能: https://paperswithcode.com/sota/image-classification-on-imagenet

KatsuhisaMorita commented 9 months ago

SSLで比較に用いたCNNモデルは

  1. ResNet
  2. EfficientNet
  3. Regnet
  4. densenet
  5. convnext の5つで、torchvisionにて実装されている (https://pytorch.org/vision/stable/models.html)

GradCamは任意のCNNでgradを逆計算足し合わせしてヒートマップを得ることが可能。 (SSL病理画像で実装したことあり)

KatsuhisaMorita commented 9 months ago

月の"シルエット"を認識したい場合、ViTがその性質にあっている 月の"テクスチャ"を認識したい場合、CNNがよさそう。 ヒトの認識性はシルエットによっているので、ViTの方がより直感にはあっている。 参考: https://qiita.com/wakayama_90b/items/e2c9f5e65aec08ffc122

モデルは動かせるようにしつつ、

このあたりか 問題なければcloseお願いします。

groovy-phazuma commented 9 months ago

あざす。確認しました。