DwangoMediaVillage / paper_readings

Dwango Media Village内で行われている論文紹介の資料
58 stars 2 forks source link

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments #34

Open kogaki opened 6 years ago

kogaki commented 6 years ago

異なるポリシーを持つ複数エージェントの強化学習を達成。競争的なタスクも解ける。

論文本体・著者

解きたい問題

新規性

実装

マルチエージェント・Actor-criticでの学習

image
論文 Fig. 1 より

他のエージェントのポリシーの推定

アンサンブル学習

各エージェントそれぞれがばらばらに学習していくことから、局所解に陥りやすい。エピソードごとにsub policyの中から一つを使う、というアンサンブルで解決

実験・議論

image
論文 Fig.3より

読んだ中での不明点などの感想

関連論文

33

36 Machine Theory of Mind