Closed iamsile closed 1 year ago
您好,请问VisualGLM-6B在训练时用的是left-padding还是right-padding,我在用VisualGLM-6B训练reward model时,会报assert divergence_ind >0的错误,打印信息时发现divergence_ind[0],我去deepspeed上查了一下,说是模型padding导致的,所以想咨询一下,VisualGLM-6B是left-padding还是right-padding
期待您的回复
文本部分是right padding
好的,感谢感谢
您好,请问VisualGLM-6B在训练时用的是left-padding还是right-padding,我在用VisualGLM-6B训练reward model时,会报assert divergence_ind >0的错误,打印信息时发现divergence_ind[0],我去deepspeed上查了一下,说是模型padding导致的,所以想咨询一下,VisualGLM-6B是left-padding还是right-padding
期待您的回复