Open fulfulggg opened 1 month ago
ソースフリー領域汎化 (SFDG) は、ソースドメインデータにアクセスすることなく、未知のターゲットドメインにモデルを適応させるという課題に取り組んでいます。この困難なタスクに対処するため、SFDG の最近の進歩では、CLIP などの視覚言語モデルのテキストモダリティの活用に主に焦点が当てられています。これらの方法には、テキストから抽出された多様なスタイル特徴と学習されたプロンプトに基づいて転移可能な線形分類器を開発すること、またはドメインバンクからドメイン統一テキスト表現を導出することが含まれます。ただし、スタイル特徴とドメインバンクの両方に、包括的なドメイン知識を捉えることに限界があります。本研究では、スタイル特徴の分布をより適切に捉え、リサンプリングを採用してドメイン知識の徹底的なカバレッジを確保するように設計された、プロンプト駆動型テキストアダプター (PromptTA) メソッドを提案します。この豊富なドメイン情報をさらに活用するために、これらのスタイル特徴から学習して効率的なドメイン情報ストレージを実現するテキストアダプターを導入します。4 つのベンチマークデータセットで実施された広範な実験により、PromptTA が最先端のパフォーマンスを達成することが実証されました。コードは https://github.com/zhanghr2001/PromptTA で入手できます。
この論文は、学習時に見たことのないデータ(未知のターゲットドメイン)に対してもAIモデルがうまく機能するようにするための新しい手法、PromptTAを提案しています。
一言でまとめると: PromptTAは、より多くのドメイン情報を効率的に取得・活用することで、未知のデータに対しても高い性能を発揮するAIモデルを実現する手法です。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
タイトル: PromptTA: ソースフリー領域汎化のためのプロンプト駆動型テキストアダプター
リンク: https://arxiv.org/abs/2409.14163
概要:
ソースフリー領域汎化 (SFDG) は、ソースドメインデータにアクセスすることなく、未知のターゲットドメインにモデルを適応させるという課題に取り組んでいます。この困難なタスクに対処するため、SFDG の最近の進歩では、CLIP などの視覚言語モデルのテキストモダリティの活用に主に焦点が当てられています。これらの方法には、テキストから抽出された多様なスタイル特徴と学習されたプロンプトに基づいて転移可能な線形分類器を開発すること、またはドメインバンクからドメイン統一テキスト表現を導出することが含まれます。ただし、スタイル特徴とドメインバンクの両方に、包括的なドメイン知識を捉えることに限界があります。本研究では、スタイル特徴の分布をより適切に捉え、リサンプリングを採用してドメイン知識の徹底的なカバレッジを確保するように設計された、プロンプト駆動型テキストアダプター (PromptTA) メソッドを提案します。この豊富なドメイン情報をさらに活用するために、これらのスタイル特徴から学習して効率的なドメイン情報ストレージを実現するテキストアダプターを導入します。4 つのベンチマークデータセットで実施された広範な実験により、PromptTA が最先端のパフォーマンスを達成することが実証されました。コードは https://github.com/zhanghr2001/PromptTA で入手できます。