arXivTimes / arXivTimes

repository to research & share the machine learning articles
https://arxivtimes.herokuapp.com/
MIT License
3.89k stars 201 forks source link

Parameter Space Noise for Exploration #370

Open icoxfog417 opened 7 years ago

icoxfog417 commented 7 years ago

一言でいうと

ノイズの入れ方で学習効率が大きく変わるという話。通常の強化学習では行動を決定した後にノイズで散らすが、提案手法は行動を決定するネットワーク自体にノイズを乗せる。既存の手法ではエージェントの意思決定とは無関係にノイズが作用するので、予測不能な探索をする可能性があったとのこと。

image

論文リンク

https://arxiv.org/abs/1706.01905

著者/所属機関

Matthias Plappert, Rein Houthooft, Prafulla Dhariwal, Szymon Sidor, Richard Y. Chen, Xi Chen, Tamim Asfour, Pieter Abbeel, Marcin Andrychowicz

概要

新規性・差分

手法

結果

コメント

matsu13an commented 7 years ago

恣意的にノイズを組み込む事で意図的に学習させることが出来る(人間の学習にそういう面がある事は否めない)とも受取れると感じました. 影響度をフィードバックし、ノイズの入れ方のガイドラインを要すると思います.