z814081807 / DeepNER

天池中药说明书实体识别挑战冠军方案;中文命名实体识别;NER; BERT-CRF & BERT-SPAN & BERT-MRC;Pytorch
920 stars 229 forks source link

(注意:需人工将 vocab.txt 中两个 [unused] 转换成 [INV] 和 [BLANK]) 刚开始参加nlp比赛不太懂这句话什么意思。 #40

Closed Torres9999 closed 2 years ago

Torres9999 commented 2 years ago

我下载了 百度云的模型, 观察了 uer_roberta-large. vocab.TXT 和roberta-wwm的vocab.TXT 的前几行 ,您的意思是把roberta-wwmz中的开始出现的两行unused替换成 和uer_roberta vocab中一样的格式吗。 image image

z814081807 commented 2 years ago

我下载了 百度云的模型, 观察了 uer_roberta-large. vocab.TXT 和roberta-wwm的vocab.TXT 的前几行 ,您的意思是把roberta-wwmz中的开始出现的两行unused替换成 和uer_roberta vocab中一样的格式吗。 image image

对的 有的没替换手动替换就行

z814081807 commented 2 years ago

我下载了 百度云的模型, 观察了 uer_roberta-large. vocab.TXT 和roberta-wwm的vocab.TXT 的前几行 ,您的意思是把roberta-wwmz中的开始出现的两行unused替换成 和uer_roberta vocab中一样的格式吗。 image image

可以参考closed issues 中 词汇表的回答