Thảo luận Reinforcement learning

mlbvn / ml-yearning-vi

Một cuốn sách tập trung vào hướng dẫn cách cấu trúc các dự án Học Máy và phân tích cách làm cho các thuật toán Học Máy hoạt động.

894 stars 342 forks source link

Thảo luận Reinforcement learning #504

Closed phamdinhkhanh closed 3 years ago

phamdinhkhanh commented 4 years ago

Hiện tại đã có một thuật ngữ được cộng đồng dịch là học tăng cường, ám chỉ các thuật toán biến đổi 1 hình ảnh thành nhiều hình ảnh khác bằng các phép rotation, translation, perspective transform,.... Đó chính là data augumentation. Còn Reinforcement learning thì được dịch là Học củng cố.

Sử dụng thuật ngữ học củng cố sẽ phù hợp hơn học tăng cường khi dịch Reinforcement learning vì thuật toán Reinforcement learning sẽ củng cố lại quá trình ra quyết định của mình sau mỗi step để đạt được reward là cao nhất.

quangnhat185 commented 4 years ago

Cái này phải bàn hết sức cẩn thận. Vì hiện tại từ học tăng cường được sử dụng phổ biến hơn học củng cố tại các tài liệu ở Việt Nam. Kiểm tra trên google thì học tăng cường có gần 90 triệu result còn học củng cố chỉ có 14 triệu thôi.

Nếu xét về nghĩa thì trên wiki định nghĩa Reinforcement learning (RL) is an area of machine learning concerned with how software agents ought to take actions in an environment in order to maximize some notion of cumulative reward. Từ maximizeở đây cũng có hiểu như làtăng cường vậy

ngcthuong commented 4 years ago

học tăng cường, ám chỉ các thuật toán biến đổi 1 hình ảnh thành nhiều hình ảnh khác bằng các phép rotation, translation, perspective transform,....

ai dịch cái này vậy? Dịch như vậy là sai.

phamdinhkhanh commented 4 years ago

học tăng cường, ám chỉ các thuật toán biến đổi 1 hình ảnh thành nhiều hình ảnh khác bằng các phép rotation, translation, perspective transform,....

ai dịch cái này vậy? Dịch như vậy là sai.

Cái này là em nói theo cách hiểu của mình có tham khảo một số giải thích từ các bài viết từ forum nước ngoài chứ ko phải định nghĩa formal dịch từ nguồn nào cả. Ko biết là anh có bổ sung gì thêm ko?