wptoux / albert-chinese-large-webqa

基于百度webqa与dureader数据集训练的Albert Large QA模型
Apache License 2.0
75 stars 15 forks source link

输出UNK的问题 #6

Closed marvel2120 closed 2 years ago

marvel2120 commented 2 years ago

answer = self.tokenizer.decode(input_ids[answer_start[0][i]:answer_end[0][i] + 1], skip_special_tokens=True) 当在从input_id转tokens的时候存在unk的情况,这种情况下怎么才能将unk对应到原文的内容呢?

例子: 问题:我居住在哪里? 段落:我居住在adsffasdf

应该输出adsffasdf 但是上面代码输出[UNK]

marvel2120 commented 2 years ago

知道问题所在了