SkyworkAI / Skywork

Skywork series models are pre-trained on 3.2TB of high-quality multilingual (mainly Chinese and English) and code data. We have open-sourced the model, training data, evaluation data, evaluation methods, etc. 天工系列模型在3.2TB高质量多语言和代码数据上进行预训练。我们开源了模型参数,训练数据,评估数据,评估方法。
Other
1.21k stars 111 forks source link

当前eval_loss脚本不支持chatglm系列模型 #64

Closed wbq9224 closed 9 months ago

wbq9224 commented 9 months ago

如题,当前eval_loss脚本不支持chatglm系列模型。可否补上相关评测。 或者怎么改支持呢,我试了下好像chatglm的tokenizer属性不太一致,并且padding_side也和eval中写的不一样,导致强行用这个脚本测出的loss是inf。

zhao1iang commented 9 months ago

您好,最新的脚本已添加对chatglm3的支持,我本地跑了一下,loss是正常的。