citbrains / GankenKun_webots

Control of humanoid robots on webots, walking, deep-learning, Bayesian-optimization
14 stars 4 forks source link

Mat rapid #83

Open yasuohayashibara opened 10 months ago

yasuohayashibara commented 10 months ago

学習速度を上げるための試行錯誤用のブランチ

yasuohayashibara commented 10 months ago

モデルをBOXにして学習

ロボットのモデルの10倍程度で学習が進む. まだ最適化はできていない.

IMAGE

学習済みモデルをロボットで検証した様子

BOXモデルはキックをしないのと,動きの特性が異なるので完全には再現できていないが,0から学習を行うよりは良さそう.

IMAGE

yasuohayashibara commented 10 months ago

キックを含めた検証を行った. 間違えて視野を±30度としてしまった.正解は±60度でそれ以外は(-100,-100)とする. ボール周辺に集まる様子が見られたので,近寄ると得られる報酬はなくした. あと,回転方向は逆などで修正する必要がある.

BOXで12時間学習 そこそこ良い動きをしているが,まだ十分に賢いとは言えない動き(視野のせいかもしれないが...) IMAGE

ヒューマノイドでの検証 完全ではないがある程度再現できていると感じる. IMAGE