o-jill / ruversi

reversi program.
https://o-jill.github.io/ruversi/
1 stars 0 forks source link

勝ち負け以外も学習 #23

Open o-jill opened 2 years ago

o-jill commented 2 years ago

勝ち負け以外、パスとか確定石とか(他のゲームだと千日手とか)、を一緒に学習してplay時は評価値だけを使うとかいうテクがあるらしい。

ウチだと係数をより分けたり面倒くさそうだけど面倒くさい分いいことがあるかも。

o-jill commented 2 years ago

確定石について https://bassy84.net/othello-kakuteiseki1.html

打てる場所が多いほうが有利だったりするらしい。 https://bassy84.net/othello-uterukasyo.html

o-jill commented 2 years ago

シンプルに黒と白の石の数を予測するだけでも良いかもしれない。

o-jill commented 2 years ago

今何手目かを出すとか。

o-jill commented 8 months ago

最近よく聞く方策の学習?dlじゃないから無理? 方策が分かればオーダリングに使えるのかも?