Closed xiayouhong closed 10 months ago
您好,损失函数中的 t 是啥意思呀
第t个token
您好,在logit_label = self.gather_logits_labels(logits, inputs.get("labels"))这一步过程中inputs.get("labels“)会被修改,会影响下一步score的计算
https://github.com/GanjinZero/RRHF/issues/37
您好,损失函数中的 t 是啥意思呀