Closed xunfengzhangyang closed 9 months ago
感谢您的工作。以及请教您几个问题 dummy_target的作用是什么呢,query_target操作之后比query_input_id少了最后一个token,拼接的时候把dummy_target拼到res_input_id之后,这样的话labels和input_id不是就没有对齐了吗,比如input_id中的回复在第150到180的位置,它对应的内容在labels实际上是第149到179,这样后续处理loss不会有问题吗
Repeat issue.
感谢您的工作。以及请教您几个问题
dummy_target的作用是什么呢,query_target操作之后比query_input_id少了最后一个token,拼接的时候把dummy_target拼到res_input_id之后,这样的话labels和input_id不是就没有对齐了吗,比如input_id中的回复在第150到180的位置,它对应的内容在labels实际上是第149到179,这样后续处理loss不会有问题吗