Chinese GPT2推理fix - Githubissues

input_ids = tokenizer.encode(txt, return_tensors='pt') infer代码中使用bert tokenizer默认会在末尾加入特殊符号[SEP]，影响效果，改为 input_ids = tokenizer.encode(txt, return_tensors='pt',add_special_tokens=True) 效果如下:

你是谁的错? 我和男朋友在一起快一年了, 我们是大学同学, 他是我 .......

代码中其他的diff是由于notebook保存时是个字典，无顺序，其实内容一致。

yuanzhoulvpi2017 / zero_nlp

Chinese GPT2推理fix #168