tinytsunami / Web-Blog

Tinytsunami's Blog
0 stars 0 forks source link

價值迭代 Value Iteration | 羊羽手札 #34

Open tinytsunami opened 5 years ago

tinytsunami commented 5 years ago

https://www.tinytsunami.info/value-iteration/#more

這篇文章是《人工智能:一種現代的方法》及 Udacity 上的強化學習課程筆記及其他內容的整理,從馬可爾夫決策過程、價值迭代、策略迭代、Q 學習,最後到深度 Q 網路的思路。