Open fulfulggg opened 1 week ago
このレポートでは、2024年BRAVOチャレンジのトラック1に対する我々のソリューションを紹介します。このチャレンジでは、Cityscapesデータセットでモデルをトレーニングし、複数の未知のデータセットに対するロバスト性を評価します。我々のソリューションは、シンプルなセグメンテーションデコーダをDINOv2に接続し、モデル全体をファインチューニングすることで、視覚基盤モデルによって学習された強力な表現を活用します。このアプローチは、より複雑な既存のアプローチよりも優れたパフォーマンスを発揮し、チャレンジで1位を獲得しました。私たちのコードはhttps://github.com/tue-mps/benchmark-vfm-ssで公開されています。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
タイトル: 2024年BRAVOチャレンジ トラック1 第1位レポート:セマンティックセグメンテーションのためのビジョン基盤モデルのロバスト性評価
リンク: https://arxiv.org/abs/2409.17208
概要:
このレポートでは、2024年BRAVOチャレンジのトラック1に対する我々のソリューションを紹介します。このチャレンジでは、Cityscapesデータセットでモデルをトレーニングし、複数の未知のデータセットに対するロバスト性を評価します。我々のソリューションは、シンプルなセグメンテーションデコーダをDINOv2に接続し、モデル全体をファインチューニングすることで、視覚基盤モデルによって学習された強力な表現を活用します。このアプローチは、より複雑な既存のアプローチよりも優れたパフォーマンスを発揮し、チャレンジで1位を獲得しました。私たちのコードはhttps://github.com/tue-mps/benchmark-vfm-ssで公開されています。