fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

具体化強化学習エージェントの教育:言語使用の情報量と多様性 #620

Open fulfulggg opened 5 days ago

fulfulggg commented 5 days ago

タイトル: 具体化強化学習エージェントの教育:言語使用の情報量と多様性

リンク: https://arxiv.org/abs/2410.24218

概要:

現実世界では、エージェントが人間の言葉を活用して、学習タスクに必要な明示的または暗黙的な知識を獲得できることが望ましい。近年の進歩にもかかわらず、従来のアプローチのほとんどは、自然な人間のコミュニケーションを反映していない可能性のある、単純な低レベルの指示を言語入力として採用している。どのように豊かな言語使用を取り入れてタスク学習を促進するかは明らかではない。この疑問に取り組むため、本論文では強化学習(RL)エージェントを促進する上での様々な種類の言語入力を研究する。具体的には、異なるレベルの言語の情報量(過去の行動に関するフィードバックと将来のガイダンス)と多様性(言語表現のバリエーション)が、エージェントの学習と推論にどのように影響するかを調べた。4つのRLベンチマークに基づく実験結果から、多様で情報量の多い言語フィードバックで訓練されたエージェントは、汎化性能が向上し、新しいタスクに迅速に適応できることが示された。これらの知見は、オープンワールドでエージェントに新しいタスクを教える上で、言語使用が極めて重要な役割を果たすことを強調している。プロジェクトのウェブサイト:https://github.com/sled-group/Teachable_RL

fulfulggg commented 5 days ago

論文要約

fulfulggg commented 5 days ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました: