Open TMats opened 7 years ago
https://arxiv.org/abs/1707.06203
DL輪読会(塩谷さん)
むしろplannningの話に近い 強化学習の部分自体はモデルフリー プランニングからの情報はcontext informationとして活用する
https://arxiv.org/abs/1707.06203