Closed ghost closed 3 years ago
并没有统一的值,需要在你的数据上自行调整。通常以默认值为基准向两边适当调整以寻求最佳学习率。 small/small-ex/base/large: 5e-4 / 5e-4 / 1e-4 / 5e-5
并没有统一的值,需要在你的数据上自行调整。通常以默认值为基准向两边适当调整以寻求最佳学习率。 small/small-ex/base/large: 5e-4 / 5e-4 / 1e-4 / 5e-5