Open akaridoi opened 3 years ago
episotic reward で評価することがいいのか? NNの出力が負になったときに,数値としても悪くなっているのかどうか?
0.1をとって,変位であるθ2上をいれてみる
episotic reward で評価することがいいのか? NNの出力が負になったときに,数値としても悪くなっているのかどうか?
0.1をとって,変位であるθ2上をいれてみる