Open kogaki opened 6 years ago
Machine Teory of Mind: ふるまいから、他のエージェントのポリシーを推定する。間違いも模倣できる
以下の3ステップでより複雑なエージェントの実験を行なっている
左のシチュエーションでは、Sallyから見えている範囲でゴールが変わる。なので、予測(d)は、即座にピンクを避ける / 青に向かうを選択できている
右のシチュエーションでは、 Sallyから見えないところで ゴールが変えられてしまった
もう一点実験2と違い、星 -> 自分の好きな色 という二段階のゴールがある、これをmental net部分でモデル化できていることにも注意
Machine Teory of Mind: ふるまいから、他のエージェントのポリシーを推定する。間違いも模倣できる
論文本体・著者
解きたい問題
新規性
実装
実験・議論
以下の3ステップでより複雑なエージェントの実験を行なっている
実験2
実験4: Sally Anne Testの再現
左のシチュエーションでは、Sallyから見えている範囲でゴールが変わる。なので、予測(d)は、即座にピンクを避ける / 青に向かうを選択できている
右のシチュエーションでは、 Sallyから見えないところで ゴールが変えられてしまった
もう一点実験2と違い、星 -> 自分の好きな色 という二段階のゴールがある、これをmental net部分でモデル化できていることにも注意
読んだ中での不明点などの感想
関連論文
34 Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments