Open ryryrymyg opened 2 years ago
Luxというゲームで勝つためのAIを強化学習で作成する。
1日に5体のボットを作成し投稿可能。 それらは毎日マッチを繰り返す。 結果によってスキルレートが割り振られ、レートはガウス関数 N(μ, σ)で表現される。 μ: 推定スキルレート(中央値) σ: 不確実性(分散)
投稿作品をアップロードすると、まず検証エピソードが再生され、その投稿作品が自分自身のコピーと対戦して正常に動作することが確認される。
そのSubmissionはErrorと表示され、原因究明のためにエージェント・ログをダウンロードすることができる。
その投稿はμ0=600で初期化され、継続的な評価のために「すべての投稿」のプールに入る。
全投稿のプールからエピソードを繰り返し実行し、似たような評価の投稿を選んで公正なマッチングを行うようにしている。新規に登録されたエージェントには、より迅速なフィードバックを提供するために、エピソードの実行回数が増加する。
エピソードが終了すると、そのエピソードに登場した全投稿作品のレーティング推定値が更新される。
また、結果によって得られた情報量に応じて、σ項を減らす。ボットのエピソードの勝敗を決めるスコアは、スキル評価の更新には影響しない。
12月6日の応募締め切り時点で、追加の応募はロックされる。12月7日から12月20日までは、引き続きゲームを実施する。この期間が終了した時点で、リーダーボードが確定し、各種ランキング賞品の決定に使用される。
LUX AI
Description
Introduction
Luxというゲームで勝つためのAIを強化学習で作成する。
Evaluation
1日に5体のボットを作成し投稿可能。 それらは毎日マッチを繰り返す。 結果によってスキルレートが割り振られ、レートはガウス関数 N(μ, σ)で表現される。 μ: 推定スキルレート(中央値) σ: 不確実性(分散)
submission
投稿作品をアップロードすると、まず検証エピソードが再生され、その投稿作品が自分自身のコピーと対戦して正常に動作することが確認される。
このエピソードが失敗した場合
そのSubmissionはErrorと表示され、原因究明のためにエージェント・ログをダウンロードすることができる。
成功した場合
その投稿はμ0=600で初期化され、継続的な評価のために「すべての投稿」のプールに入る。
対戦相手のマッチングについて
全投稿のプールからエピソードを繰り返し実行し、似たような評価の投稿を選んで公正なマッチングを行うようにしている。新規に登録されたエージェントには、より迅速なフィードバックを提供するために、エピソードの実行回数が増加する。
エピソード(対戦?)後のスキルレートの変化について
エピソードが終了すると、そのエピソードに登場した全投稿作品のレーティング推定値が更新される。
また、結果によって得られた情報量に応じて、σ項を減らす。ボットのエピソードの勝敗を決めるスコアは、スキル評価の更新には影響しない。
最終評価
12月6日の応募締め切り時点で、追加の応募はロックされる。12月7日から12月20日までは、引き続きゲームを実施する。この期間が終了した時点で、リーダーボードが確定し、各種ランキング賞品の決定に使用される。