shibing624 / MedicalGPT

MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型，实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO。

Apache License 2.0

2.94k stars 451 forks source link

结论

灾难性遗忘，增量预训练起了反效果

文言文

具体数据我就保密了，只说一下相对结果指标：BLEU 预训练前：x 预训练后：x-7

https://zhuanlan.zhihu.com/p/636334904 chatglm自己给出的答案其实也可以参考一下官方仓库里关于增量预训练的讨论，没有确切的支持增量预训练的结论

也可能是我跑的有问题，不过我看issue里也提到了类似的问题https://github.com/shibing624/MedicalGPT/issues/280

shibing624 / MedicalGPT