Duxiaoman-DI / XuanYuan

轩辕:度小满中文金融对话大模型
1.07k stars 97 forks source link

增量预训练阶段的配置 #16

Closed tzt101 closed 10 months ago

tzt101 commented 10 months ago

您好,请问可以提供一些增量预训练时候的训练配置吗?例如,学习率、batch size、warmup、weight_decay等参数。