Closed LanShanPi closed 6 months ago
跑dpo的时候出现下面的问题: 其中上图中红色框是下面这张图中红框的输出: 第二张图所在文件为: /XXX/XXX/miniconda3/envs/medical/lib/python3.9/site-packages/trl/trainer/utils.py
从输出的数据来看,错误是因为列表中出现了None值,导致torch.LongTensor()出错,我没有改变数据,然后用的是chatglm3-6b的模型。
用llama类gpt结构的模型跑dpo
这样啊,好吧,谢谢啦
dpo不支持chatglm吗
你好,使用qwen-chat版本不行吗
跑dpo的时候出现下面的问题:
其中上图中红色框是下面这张图中红框的输出:
第二张图所在文件为:
/XXX/XXX/miniconda3/envs/medical/lib/python3.9/site-packages/trl/trainer/utils.py
从输出的数据来看,错误是因为列表中出现了None值,导致torch.LongTensor()出错,我没有改变数据,然后用的是chatglm3-6b的模型。