Closed bonlime closed 5 years ago
Не знаю зачем они нам реально нужны, но пусть будут 1) хорош для тренировки с большим батчем https://github.com/cybertronai/pytorch-lamb 2) просто набор каких-то супер модных оптимизаторов, чтобы почувствовать себя старым https://github.com/mgrankin/over9000
Добавил Novograd но он почему-то замедляет тренировку. Утилизация с SGD ~99%, а с Novograd ~70%
прошлая проблема пофиксилась переходом на FusedNovograd. Нет смысла копипастить себе их код, поэтому удалил Novograd
Не знаю зачем они нам реально нужны, но пусть будут 1) хорош для тренировки с большим батчем https://github.com/cybertronai/pytorch-lamb 2) просто набор каких-то супер модных оптимизаторов, чтобы почувствовать себя старым https://github.com/mgrankin/over9000