Open yasuohayashibara opened 10 months ago
学習速度を上げるための試行錯誤用のブランチ
ロボットのモデルの10倍程度で学習が進む. まだ最適化はできていない.
BOXモデルはキックをしないのと,動きの特性が異なるので完全には再現できていないが,0から学習を行うよりは良さそう.
キックを含めた検証を行った. 間違えて視野を±30度としてしまった.正解は±60度でそれ以外は(-100,-100)とする. ボール周辺に集まる様子が見られたので,近寄ると得られる報酬はなくした. あと,回転方向は逆などで修正する必要がある.
BOXで12時間学習 そこそこ良い動きをしているが,まだ十分に賢いとは言えない動き(視野のせいかもしれないが...)
ヒューマノイドでの検証 完全ではないがある程度再現できていると感じる.
学習速度を上げるための試行錯誤用のブランチ