Closed dehaozhou closed 3 months ago
您好,这个问题似乎没有解决,还是卡在这一步:
This issue has been automatically marked as stale because it has not had recent activity. It will be closed if no further activity occurs. Thank you for your consideration.
Closing the issue, since no updates observed. Feel free to re-open if you need any further assistance.
提交前必须检查以下项目
问题类型
模型训练与精调
基础模型
Chinese-Alpaca-2 (7B/13B)
操作系统
Linux
详细描述问题
在指令微调载入数据集的时候一直卡在这个地方不能往后推进
依赖情况(代码类问题务必提供)
注:requirements里的包都已经按照版本安好。但是目前情况是datasets需要huggingface-hub的高版本,而tokenizers需要huggingface-hub的低版本。找不到二者的交集版本。如果选择后者,代码会报错,选择前者,代码能够运行起来不报错。这个地方的库确实感觉有点奇怪。
运行日志或截图
代码会卡在最后一行0无法载入数据集。datasets库我尝试了从2.15.0到2.18.0的每个版本,都是这种情况。单卡训练和多卡训练也是这种情况。且运行代码时gpu显存只有360兆占用。
数据集形式: { "instruction": "易学的起源是什么?", "input": "", "output": "易学的起源可以追溯到远古的人类社会,其起源与发展过程漫长且复杂。" }, { "instruction": "易学的作者是谁?", "input": "", "output": "据记载,伏羲创造了八卦图,这是易学的基础。" },
麻烦您帮我看看可能是在什么地方出了问题。