mashimashica / WM2021_LWM

世界モデルと知能2021 グループ17 (言語コミュニケーションを用いたマルチエージェントタスク(1))
3 stars 3 forks source link

2Dゲーム環境の再現 #6

Closed mashimashica closed 2 years ago

mashimashica commented 2 years ago

要件定義 ・グリッドのマップを行列データで返す ・エージェントの近傍1セルの情報を1次元配列で返す ・旗が緑 ・エージェントが青

otanet commented 2 years ago

20220322 1050時点

PyBulletやMuJoCoなどの物理シミュレーションの環境を想定していたが、OpenAIGymの環境で実装するように軌道修正し、調べながら、実装する予定です。

envzhu commented 2 years ago

参考までに 見つけるのが遅くなって申し訳ないのですが,Learning to Ground Multi-Agent Communication with Autoencodersという論文がGridゲーム環境を用いたマルチエージェントの実験を行っており,実装がしかも公開されていました. GitHub : https://github.com/ToruOwO/marl-ae-comm ここ にfind-goal(Grid上のゴールを見つけるゲーム)による実験が実装されています. 以下のライブラリが使用されているようです

otanet commented 2 years ago

上記、ありがとうございます。 Language World Modelsは、やはり、Multi-AgentとAutoencoderとで、画像データをやり取りするイメージでおります。 以前、深層強化学習の最終課題に、対話の強化学習を選んだのですが、この時よりも、画像データのやり取りにおけるlanguageということで、かんねんしたという感じです。 昨年の人工知能学会の世界モデルで、自然言語処よりの論文で、数理論理学のような概念的なアプローチとも違うので、上記のURLで慣れてゆきたいと思います。

envzhu commented 2 years ago

こちら早めに完了させたいです

otanet commented 2 years ago

現状の認識では、MarlGridで対応できると考えている。 OpenAIGym>MarlGrid https://github.com/kandouss/marlgrid/blob/master/marlgrid/envs/cluttered.py

Have done. 既存のゲーム環境を調査 Pre-built environment https://github.com/kandouss/marlgrid/blob/master/marlgrid/envs/cluttered.py →OpenAI GymとUnityにおけるゲーム環境の位置づけを概観

Next Action. 要件定義: -色を付ける: 緑と青 -値の受け渡し -Unityでやるか、見た目

以上

envzhu commented 2 years ago

こちら,無事マージされたようなのでクローズします