Closed mst272 closed 1 week ago
使用tokenizer.apply_chat_template数据时,数据结尾没有添加</ s >,但是我看模型special文件中显示"eos_token"是</ s >。所以请问一下数据结尾不加eos_token是故意设置的吗? 我使用的模型是MiniCPM-2B-dpo-bf16。
No response
你提到的是结束符,是一旦生成这个token就结束生成的作用,因此可以不再prompt里面添加,只是在生成对话的时候,如果生成了这个token,就必须被发现,否则模型不会停止
Description / 描述
使用tokenizer.apply_chat_template数据时,数据结尾没有添加</ s >,但是我看模型special文件中显示"eos_token"是</ s >。所以请问一下数据结尾不加eos_token是故意设置的吗? 我使用的模型是MiniCPM-2B-dpo-bf16。
Case Explaination / 案例解释
No response