Градиентный бустинг learning_rate

vkantor / MIPT_Data_Mining_In_Action_2016

"Data Mining in Action Course", Moscow Institute of Physics and Technologies

209 stars 175 forks source link

Градиентный бустинг learning_rate #21

Open dmylnikov opened 7 years ago

dmylnikov commented 7 years ago

На каком шаге в градиентном бустинге добавляется коэффициент learning_rate: до последнего шага, в котором оптимизируется коэффициент перед добавляемым новым деревом или после этого шага?

persiyanov commented 7 years ago

Learning rate это и есть коэффициент перед добавляемым новым деревом.

dmylnikov commented 7 years ago

На последнем шаге бустинга мы побираем коэффициент a_i перед деревом b_i(x) (в обозначениях дз). Это не learning rate, learning rate - это константа, которая должна помогать от переобучения.

senya-ashukha commented 7 years ago

Его действительно можно подбирать, но это ведь не сильно важно для понимания. Используйте просто маленькую константу.

senya-ashukha commented 7 years ago

Конечно перед новым деревом.