fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

AgroGPT: 専門家調整による効率的な農業ビジョン言語モデル #464

Open fulfulggg opened 3 days ago

fulfulggg commented 3 days ago

タイトル: AgroGPT: 専門家調整による効率的な農業ビジョン言語モデル

リンク: https://arxiv.org/abs/2410.08405

概要:

大規模マルチモーダル会話モデル(LMM)は、オンラインで入手可能な膨大な画像テキストデータを利用することで、著しい進歩を遂げました。しかし、これらのモデルは、新しいドメインにわたる複雑な会話を行う能力を阻害する、大きなドメインギャップに直面することがよくあります。最近の取り組みでは、ドメイン固有の画像テキストデータに依存して命令チューニングデータを作成することで、この問題の軽減が図られています。しかし、農業などの多くのドメインでは、そのような視覚言語データが不足しています。本研究では、農業ドメインの視覚のみのデータを利用して命令チューニングデータを作成する手法を提案します。複数のドメインにわたる多様な農業データセットを利用し、クラス固有の情報をキュレーションし、大規模言語モデル(LLM)を用いて専門家チューニングセットを作成した結果、AgroInstructと呼ばれる7万件の専門家チューニングデータセットが得られました。さらに、専門家によるチューニングを行い、複雑な農業関連の会話を維持し、有用な洞察を提供できる効率的なLMMであるAgroGPTを作成しました。また、評価のためにAgroEvalsを開発し、{AgroGPT}のパフォーマンスを、大規模なオープンソースおよびクローズドソースのモデルと比較しました。{AgroGPT}は、きめ細かい農業概念の特定に優れており、農業の専門家として行動し、マルチモーダルな農業の質問に対して役立つ情報を提供します。コード、データセット、モデルは、https://github.com/awaisrauf/agroGPT で公開されています。

fulfulggg commented 3 days ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました:

fulfulggg commented 3 days ago

論文要約

論文要約: AgroGPT: 専門家調整による効率的な農業ビジョン言語モデル

背景:

提案手法:

結果:

貢献:

その他: