Open zhangapeng opened 2 weeks ago
在跑代码的过程中loss刚开始为300多,然后一下跌到零值并且一直是零,请问是什么问题,数据集是按照百度网盘下载并放置。
建议用Llama模型进行微调,如果还出现问题,可以用 https://github.com/hiyouga/LLaMA-Factory 这个最新LLM微调框架进行微调。
在跑代码的过程中loss刚开始为300多,然后一下跌到零值并且一直是零,请问是什么问题,数据集是按照百度网盘下载并放置。