Closed ayyucekizrak closed 4 years ago
Başlık altı yazısı
Modeller ve Planlama başlığı :
Dyna: Entegre Planlama, Oyunculuk (Acting) ve Öğrenme
Model Yanlış Olduğunda başlığı
Öncelikli Süpürme başlığı
Beklenen ve Örnek Güncellemeler
Yörünge Örneklemesi
Gerçek Zamanlı Dinamik Programlama
Karar Zamanında Planlama
Sezgisel Arama
Rollout Algoritmaları TAM NOT ALINDI. 💯
Monte Carlo Arama Ağacı
Eksikleri tamamlanınca güncelleyeceğim. Elinize sağlık hocam
Güncellemesi yapıldığı için kapatıyorum. Elinize sağlık 👍
Pekiştirmeli Öğrenme - Bölüm 8: Tabular Metotlar https://yz-ai.github.io/blog/pekistirmeli-ogrenme/tabular-metotlar-bolum-8
Başlık altı yazısı için: "Modele dayalı yöntemler, temel bileşen olarak planlama yapmaya dayanırken, model içermeyen yöntemler temel olarak öğrenmeye dayanır. Bu iki yöntem arasında farklılıklar ve benzerlikler vardır. Özellikle, her iki yöntemin temelin de , değer fonksiyonlarının hesaplanması vardır. Bu bölümdeki amacımız, model tabanlı ve modelsiz yöntemlerin birleştirilmesidir (integration)."
Bu cümleyi anlamını koruyarak yeniden yazıyorum:
Bu iki yöntemin benzer ve farklı yanları vardır. En önemli farklılıkları; model gerektiren yöntemlerin temel bileşeni planlama iken model içermeyen yöntemlerin öğrenmeye dayalı bir temel bileşene sahip olmasıdır. En önemli benzerlikleri ise, değer fonksiyonlarının hesaplama gereksinimleridir. Bu bölümdeki amacımız model gerektiren ve model içermeyen yöntemlerin birleştirilmesidir (integration).
Bu lafın aynısı Planlama ve Tabular Metotlar ile Öğrenme başlığı altında da geçiyor.
Modeller ve Planlama başlığı için:
Dyna: Entegre Planlama, Oyunculuk (Acting) ve Öğrenme başlığı için:
Model Yanlış Olduğunda başlığı için:
"Model boş başladı ve daha sonra sadece tam olarak doğru bilgilerle dolduruldu. Genel olarak, bu kadar şanslı olmayı bekleyemeyiz. Modeller yanlış olabilir, çünkü ortam stokastiktir ve sadece sınırlı sayıda örnek gözlemlenmiştir, ya da model, kusurlu bir şekilde genelleştirilen fonksiyon yaklaşımı kullanılarak ya da çevrenin değiştiği ve yeni davranışının henüz gözlemlenmediği için öğrenilmiştir. Model yanlış olduğunda, planlama sürecinin optimal bir politika oluşturması muhtemeldir." Bu paragrafı yeniden yazıyorum: Boş olarak başlayan model ve sonrasında sadece doğru bilgilerle doldurulur desek de genel olarak bu kadar şanslı olmayı beklemeyiz. Ortam stokastiktir ve sadece sınırlı sayıda örnek ile gözlemlenmektedir. Bu yüzden model yanlış olabilir. Model yanlış demek; kusurlu şekilde genelleştiren fonksiyon yaklaşımı kullanılması ya da çevrenin değiştiği için yeni davranışın henüz gözlemlenmediği öğrenilmiştir. Model yanlış olduğunda planlanma sürecinin optimal bir politika oluşturması muhtemeldir.
İkinci paragrafın sondan bir önceki cümlesinin noktası yok.
Şekil İngilizce kalmış.
Öncelikli Süpürme başlığı için:
Beklenen ve Örnek Güncellemeler başlığı için:
Yörünge Örneklemesi m başlığı için:
Gerçek Zamanlı Dinamik Programlama başlığı için:
Karar Zamanında Planlama başlığı için:
Sezgisel Arama başlığı için:
Rollout Algoritmaları başlığı için: bu kısım çok güzel yazılmış.
Monte Carlo Arama Ağacı başlığı için:
Elinize sağlık 👍