troublemaker-r / Chinese_Coreference_Resolution

基于SpanBert的中文指代消解,pytorch实现
95 stars 20 forks source link

官方数据很多UNK #4

Open BugMaker-99 opened 3 years ago

BugMaker-99 commented 3 years ago

博主您好,您给的128的数据很正常,但是我用这个代码(https://github.com/mandarjoshi90/coref)处理v4_gold_conll数据得到的jsonlines文件里面很多UNK。您那边256的数据也有很多UNK嘛

troublemaker-r commented 3 years ago

如果你处理的没错的话,是一样的