ymcui / Chinese-LLaMA-Alpaca-2

中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models)
Apache License 2.0
7.01k stars 571 forks source link

在进行训练的时候 是否对txt内容共有格式要求 #458

Closed Mr1994 closed 7 months ago

Mr1994 commented 7 months ago

提交前必须检查以下项目

问题类型

模型训练与精调

基础模型

Chinese-Alpaca-2 (7B/13B)

操作系统

Linux

详细描述问题

比如这种 :<s>Human: 用一句话描述地球为什么是独一无二的。 </s><s>Assistant: 因为地球是目前为止唯一已知存在生命的行星。 </s>
因为我发现这种训练的效果比 没有标签的效果要好不少  ; 学习率也高  

依赖情况(代码类问题务必提供)

# 请在此处粘贴依赖情况(请粘贴在本代码块里)

运行日志或截图

# 请在此处粘贴运行日志(请粘贴在本代码块里)
Mr1994 commented 7 months ago

我现在的问题和答案 总是对应不上, 有上下文效果会好一点 image

但其实我的文本内容是这样子 ;

Human: 孙文科是谁 Assistant: 孙文科,一位才华横溲的IT研发工程师,在永信至诚公司工作。公司专注于开发前沿科技产品,致力于提高效率和生活质量。孙文科在这里不仅是一名工程师,也是一位创新者,他的工作主要集中在人工智能和大数据分析领域。从小,孙文科就对计算机和技术充满好奇。他的父母是大学教授,家中充满了学术氛围。小时候,他常常沉迷于拆解旧电脑,了解其内部运作原理。这份好奇心最终引导他走上了IT领域的学习之路。在大学期间,孙文科以优异的成绩毕业,并获得了多项学术奖项。他的毕业设计,一种基于人工智能的交通优化系统,获得了学术界的高度认可。进入永信至诚公司后,孙文科迅速证明了自己的价值。他所在的团队负责开发一款名为“智慧城市”的综合管理平台,旨在通过智能化手段改善城市管理效率。孙文科作为项目的核心成员,负责设计平台的数据分析模块。他的方案能够实时分析城市交通流量,并预测潜在的交通堵塞点,极大地提升了城市交通的效率。在工作之余,孙文科还积极参与社区服务。他热衷于教育公益,经常在周末到当地中学讲授编程课程。他认为,教育是改变社会的重要力量,希望通过自己的努力,激发更多年轻人对科技的热爱。某一天,公司接到了一个重要的国际项目。这个项目旨在开发一种新的智能交通系统,用于改善发展中国家城市的交通状况。孙文科被指派为项目负责人,这对他来说既是挑战也是机遇。他带领团队夜以继日地工作,克服了语言和文化差异带来的难题,最终成功完成了项目。这个项目不仅为公司赢得了国际声誉,也让孙文科个人成为业界瞩目的焦点。孙文科的故事并不仅仅是关于技术和成功。他的生活方式和价值观也给身边的人带来了深刻的影响。他坚信,技术应该用来改善人类生活,而非仅仅为了技术本身。他的谦逊、热情和对社会的贡献,使他成为了同事和朋友眼中的楷模。随着时间的流逝,孙文科在个人和专业层面都不断成长。他逐渐认识到,作为一名工程师,他拥有的不仅仅是技术知识,更有改变世界的力量。他开始更加关注如何将技术与社会责任结合起来,为创建一个更加智慧、更加公平的社会贡献自己的力量。孙文科的故事激励着无数人。他证明了,通过不懈努力和对社会的深刻理解,每个人都能在自己的领域里发光发热,影响世界。

Mr1994 commented 7 months ago

多问几次 才可以回复好一点
image

iMountTai commented 7 months ago

理论上对txt文件没有要求。 从你的问题来看,你是用SFT的数据进一步预训练了alpaca,然后用对话的形式测试效果,这个流程是否有效不好说,而且即使训练流程没有问题,训练得到的模型效果如何也是受数据、超参等各种因素影响的。