finetune结果模型只有13M

OpenBMB / CPM-Bee

百亿参数的中英文双语基座大模型

2.68k stars 211 forks source link

Open jiangliqin opened 1 year ago

jiangliqin commented 1 year ago

训练日志没有异常信息，但是最终cpm_bee_finetune-delta-best.pt只有13m

zh-zheng commented 1 year ago

因为使用了增量微调（--use-delta参数），只保存了LoRA的权重

jiangliqin commented 1 year ago

是的，text_generation.py有Lora使用说明，谢谢~

jiangliqin commented 1 year ago

请问是否支持多任务的finetune,讲数据构造成多任务的格式？

gongbaitao commented 1 year ago

您可以将每种任务设计一种数据格式，然后把所有任务的数据混合起来微调即可

fengcai24 commented 1 year ago

您可以将每种任务设计一种数据格式，然后把所有任务的数据混合起来微调即可

请问预训练脚本要用什么数据格式呢？