z814081807 / DeepNER

天池中药说明书实体识别挑战冠军方案;中文命名实体识别;NER; BERT-CRF & BERT-SPAN & BERT-MRC;Pytorch
920 stars 229 forks source link

bert/torch_roberta_wwm放的是哪个预训练模型文件 #22

Closed tianke0711 closed 3 years ago

tianke0711 commented 3 years ago

我想问一下这个注意具体指的是哪个训练模型的 (torch_roberta_wwm, uer_large?)(注意:需人工将 vocab.txt 中两个 [unused] 转换成 [INV] 和 [BLANK])

z814081807 commented 3 years ago

我想问一下这个注意具体指的是哪个训练模型的 (torch_roberta_wwm, uer_large?)(注意:需人工将 vocab.txt 中两个 [unused] 转换成 [INV] 和 [BLANK])

都需要改,有的改过了就不用改,数据处理tokenizer需要

TinaGioro commented 2 years ago

你好,请问目录out/final和out/stack都发一下吗

TinaGioro commented 2 years ago

还有我想请问下“需人工将 vocab.txt 中两个 [unused] 转换成 [INV] 和 [BLANK])” 是指的是人工选定[unused]的位置更改吗

TinaGioro commented 2 years ago

还有想请问下您们模型使用的chinese_bert_wwm是哪个版本的啊,我下载的是chinese_wwm_pytorch貌似不太对。大神大佬求助下,菜鸟程序媛在此跪谢了!