takumi7110 / paper

0 stars 0 forks source link

[2023]MindAgent: Emergent Gaming Interaction #2

Open takumi7110 opened 1 year ago

takumi7110 commented 1 year ago

【背景】 • LLMは、大規模なテキストコーパスで訓練されることで、複雑なタスクを解決する能力を持つことが示されている。 • マルチエージェントの協力インフラストラクチャを構築するためのベンチマークが不十分である。 【目的】 • 新しいインフラストラクチャ「MindAgent」を提案し、ゲームインタラクションにおける計画と協調の能力を評価する。 • MindAgentは、既存のゲームフレームワークを活用し、人間プレイヤーと協力し、フィードバック付きのコンテキスト学習を行う。 【手法】 • 新しいゲームシナリオと関連ベンチマークを導入し、マルチエージェントの協力効率をディスパッチし、ゲームをプレイする。 • LLMを使用して、MindAgentのインフラストラクチャを介してゲームをプレイし、協力効率を計算するための新しい自動メトリックを使用して評価する。 【実験方法】 • LLMを使用してゲームレベルで評価し、ゼロショットマルチエージェントプランニングの能力を確認する。 • 少数のエキスパートデモンストレーションをプロンプトに追加し、プランニング中にLLMにフィードバックを提供することで、パフォーマンスを向上させる。 【実験結果】 • LLMは、単純なゲームの指示とレシピを読むだけで、2〜4人のエージェントをスケジュールし、人間プレイヤーとも協力して料理を完成させる能力を持つことが確認された。 • 少数のエキスパートデモンストレーションをプロンプトに追加することで、LLMのパフォーマンスを向上させることができることが示された。 • LLMは、より少ないエージェントの例を使用してより多くのエージェントを調整する能力を持ち、新しいゲームドメインに適応することができる。 【考察】 • LLMを使用したマルチエージェントプランニングは、課題に直面するが、ファインチューニングなしで改善する可能性がある。 • LLMは、大規模なテキストコーパスから学習することで、一般的なスケジューリングと協調の能力を獲得する方法についての示唆を提供することができる。

takumi7110 commented 1 year ago

https://arxiv.org/abs/2309.09971

PDF: https://arxiv.org/pdf/2309.09971.pdf

takumi7110 commented 1 year ago

2309 09971v1 MindAgent_Emergent_Gaming_Interaction-Table7-1 2309 09971v1 MindAgent_Emergent_Gaming_Interaction-Table8-1 2309 09971v1 MindAgent_Emergent_Gaming_Interaction-Table9-1 2309 09971v1 MindAgent_Emergent_Gaming_Interaction-Table6-12309 09971v1 MindAgent_Emergent_Gaming_Interaction-Table3-1

takumi7110 commented 1 year ago

以下で取り上げられている。 https://aiboom.net/archives/55563