SCIR-HI / Huatuo-Llama-Med-Chinese

Repo for BenTsao [original name: HuaTuo (华驼)], Instruction-tuning Large Language Models with Chinese Medical Knowledge. 本草(原名:华驼)模型仓库,基于中文医学知识的大语言模型指令微调
Apache License 2.0
4.31k stars 422 forks source link

指令微调的训练集的数据分布 #85

Closed zhangyu68 closed 8 months ago

zhangyu68 commented 9 months ago

请问训练集中只包含医疗领域的数据吗,还是融入了一定比例的通用数据

s65b40 commented 9 months ago

您好,我们只包含了医疗领域数据,因此会存在通用能力的下降,如您有需要,可以进行通用数据的融入

zhu-code commented 6 days ago

请问llama_data.json这个文件就用cmedkg构建的数据吗