zjunlp / IEPile

[ACL 2024] IEPile: A Large-Scale Information Extraction Corpus
http://oneke.openkg.cn/
Other
157 stars 14 forks source link

ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 0 (pid: 2788) of binary: /root/miniconda3/bin/python #9

Closed EternalSeer closed 4 months ago

EternalSeer commented 5 months ago

img_v3_02a9_f92cea47-7595-4d9e-8472-ccc84f0521fg 有哪个大佬遇到一样的错么?

guihonghao commented 4 months ago

看起来是模型下载的问题。

EternalSeer commented 4 months ago

看起来是模型下载的问题。

模型从modelscope下载的,好离谱。。

guihonghao commented 4 months ago

你好,modelscope上只有OneKE(基于llama2)的模型,看你的截图,你使用的是Baichuan模型。 OneKE的继续训练是:https://github.com/zjunlp/IEPile/blob/main/README_CN.md#432lora%E8%AE%AD%E7%BB%83 OneKE的推理是:https://github.com/zjunlp/IEPile/blob/main/README_CN.md#53ie%E4%B8%93%E7%94%A8%E6%A8%A1%E5%9E%8B%E9%A2%84%E6%B5%8B

zxlzr commented 4 months ago

请问您的问题是否已解决?

EternalSeer commented 4 months ago

请问您的问题是否已解决?

还是报错了,在调试

EternalSeer commented 4 months ago

请问您的问题是否已解决?

已经解决了,重新下载了模型,换了训练集的大小就正常了,多谢大佬

EternalSeer commented 4 months ago

你好,modelscope上只有OneKE(基于llama2)的模型,看你的截图,你使用的是Baichuan模型。 OneKE的继续训练是:https://github.com/zjunlp/IEPile/blob/main/README_CN.md#432lora%E8%AE%AD%E7%BB%83 OneKE的推理是:https://github.com/zjunlp/IEPile/blob/main/README_CN.md#53ie%E4%B8%93%E7%94%A8%E6%A8%A1%E5%9E%8B%E9%A2%84%E6%B5%8B

正常了,多谢大佬!