pocokhc / r2d2

Qiita投稿用に作成したR2D2(強化学習)の実装コードです。
MIT License
0 stars 0 forks source link

聞く #1

Open AlejoCarpentier007 opened 2 weeks ago

AlejoCarpentier007 commented 2 weeks ago

こんにちは。現在開発しているフレームワークがカスタム環境を作成するときに GYM および GYMNASIUM と互換性を持つように設計されているか、それとも EnvBase クラスを使用してフレームワーク内で環境を最初から作成する必要があるのか​​を知りたいです。

pocokhc commented 2 weeks ago

はい。

現在開発している以下のフレームワークはGYM/GYMNASIUMと互換があります。 https://github.com/pocokhc/simple_distributed_rl

GYMNASIUMをベースに作成された環境はそのままSRLフレームワークで実行できます。 簡単ですが、以下は"FrozenLake-v1"をQ学習で学習するコード例です。

import srl
from srl.algorithms import ql

# "FrozenLake-v1"はGym/Gymnisiumで実装された環境です
runner = srl.Runner("FrozenLake-v1", ql.Config())

# train
runner.train(timeout=10)

# evaluate
rewards = runner.evaluate()
print(f"evaluate episodes: {rewards}")