サブサンプリング層を持つディープネットは、テスト時に有用な活性化を意図せずに破棄してしまう

fulfulggg commented 3 days ago

タイトル: サブサンプリング層を持つディープネットは、テスト時に有用な活性化を意図せずに破棄してしまう

リンク: https://arxiv.org/abs/2410.01083

概要:

サブサンプリング層は、深層学習において、活性化マップの一部を破棄して空間次元を削減することで重要な役割を果たし、深層学習モデルが高レベルな表現を学習することを促します。この考えとは逆に、我々は破棄された活性化も有用であり、モデルの予測精度向上に活用できると仮説を立てました。この仮説を検証するため、テスト時に使用するのに適した活性化マップを探索して集約する方法を提案します。この方法を画像分類とセマンティックセグメンテーションのタスクに適用しました。複数のデータセットを用いて9つの異なるアーキテクチャで広範な実験を行った結果、この方法は既存のテスト時拡張技術を補完し、モデルのテスト時性能を一貫して向上させることが示されました。コードは https://github.com/ca-joe-yang/discard-in-subsampling で公開しています。

fulfulggg commented 3 days ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました：

deep-learning
model-compression
efficient-ml

fulfulggg commented 3 days ago

論文要約

論文要約:

従来の考え方: 深層学習モデルで使われるサブサンプリング層は、画像サイズを小さくするために一部の情報を意図的に捨てて処理を効率化し、高度な特徴の学習を促すとされてきた。
この論文の発見: サブサンプリング層で捨てられている情報の中にも、モデルの精度向上に役立つ有用な情報が含まれている。
提案手法: テスト時に、捨てずに残しておくべき有用な情報を選択して集約する方法を開発した。
実験結果: 画像分類とセマンティックセグメンテーションのタスクにおいて、提案手法が既存手法を上回る精度向上を実現した。
- 複数のデータセット、9種類のネットワーク構造で有効性を確認。
結論: サブサンプリング層で捨てられている情報は、モデルの精度向上に活用できる可能性がある。

fulfulggg / Information-gathering