Llama3 微调文本分类数据集准备的格式，以及微调后模型回答输出非标签内容 - Githubissues

hiyouga / LLaMA-Factory

Unify Efficient Fine-Tuning of 100+ LLMs

Apache License 2.0

25.26k stars 3.13k forks source link

Llama3 微调文本分类数据集准备的格式，以及微调后模型回答输出非标签内容 #4550

Closed git3210 closed 3 days ago

git3210 commented 3 days ago

Reminder

[X] I have read the README and searched the existing issues.

System Info

sft模型 FlagAlpha/Llama3-Chinese-8B-Instruct，文本分类任务，数据集格式： ~~Human: 请给出下面文本对应分类标签, {文本正文}\r\nAssistant: {标签}\r\n~~ 遇到的问题如下，请问问题点出现在哪里？数据集格式不对还是其它问题？谢谢

微调后回答内容非标签内容
部分训练文本标签内容输出不正确

Reproduction

遇到的问题如下，请问问题点出现在哪里？数据集格式不对还是其它问题？谢谢

微调后回答内容非标签内容
部分训练文本标签内容输出不正确

Expected behavior

No response

Others

No response

hiyouga commented 3 days ago

无法复现