Closed takachino closed 3 months ago
本論文は、ビジョン言語モデル時代における汎化された外部分布検出に焦点を当てており、機械学習システムの安全性を確保するために外部分布サンプルの検出が重要であると述べています。異常検出、新奇検出、オープンセット認識、および外れ値検出などの関連問題についても言及し、これらを統一するフレームワークが提案されています。また、ビジョン言語モデルの影響を受け、OD検出やADに対する新たなアプローチが必要であることが強調されています。さらに、新興ビジョン言語モデル時代の進歩についても議論され、未解決の課題や将来の研究方向についてまとめられています。
@offloading が以下のラベルを提案し、適用しました:
タイトル: ビジョン言語モデル時代における汎化された外部分布検出とその先に:サーベイ
リンク: https://arxiv.org/abs/2407.21794
概要:
機械学習システムの安全性を確保するために、外部分布(OOD)サンプルの検出は重要であり、OOD検出の分野を形作ってきました。一方、異常検出(AD)、新奇検出(ND)、オープンセット認識(OSR)、および外れ値検出(OD)など、他の問題もOOD検出と密接に関連しています。これらの問題を統一するために、一般的なOOD検出フレームワークが提案され、これらの5つの問題が分類されました。しかし、CLIPなどのビジョン言語モデル(VLMs)は、そのパラダイムを大きく変え、これらの分野の境界を曖昧にし、再び研究者を混乱させています。この調査では、VLM時代におけるAD、ND、OSR、OOD検出、およびODの進化を包括した一般的なOOD検出v2をまず提案します。我々のフレームワークは、一部の領域の不活性と統合により、求められる課題がOOD検出とADになったことを示しています。さらに、定義、問題設定、およびベンチマークの重要な変化にも焦点を当て、OOD検出の手法について包括的なレビューを行い、その関連するタスクについての議論を通じて、OOD検出との関係を明確にしています。最後に、GPT-4Vなどの新興ビジョン言語モデル(LVLM)時代の進歩について探求します。本調査では、開かれた課題と将来の方向性で締めくくります。