一个简单的中国象棋gym环境,可以产出类似Alpha zero算法需要的带有历史盘面的observation.
运行如下指令安装中国象棋gym环境
pip install -e .
阅读 gym_101.ipynb 查看一些简单的使用例子.
在安装完gym-chinese-chess之后你可以简单的使用下面命令创建一个中国象棋环境
import gym
chinese_chess_env = gym.make('gym_chinese_chess:cchess-v0')
并且可以通过
print(chinese_chess_env.render())
来展示当前盘面:
9俥傌象士将士象傌俥
8.........
7.砲.....砲.
6卒.卒.卒.卒.卒
5.........
4.........
3兵.兵.兵.兵.兵
2.炮.....炮.
1.........
0车马相仕帅仕相马车
abcdefghi
可以通过
actions = chinese_chess_env.get_possible_actions()
获取action space中的所有当前局面下的可能action的integer list
也可以通过
moves = chinese_chess_env.get_possible_moves()
来取得局面下所有可能action的字符串形式
然后通过
state, reward, done, info = chinese_chess_enf.step(action)
的方式获得gym规范的state,reward,游戏是否结束标志done和一些调试信息info。
如果done为True,则游戏已经结束,
其他中国象棋gym的用法在gym_101.ipynb中有列举,请参考其中列举的方法,相信你可以很快上手。