train - Githubissues

WuHuRestaurant / xf_event_extraction2020Top1

科大讯飞2020事件抽取挑战赛第一名解决方案&完整事件抽取系统

536 stars 123 forks source link

train #28

Closed strawberrybbq closed 3 years ago

strawberrybbq commented 3 years ago

train.sh模型找不到

strawberrybbq commented 3 years ago

运行时显示OSError: Model name './bert/torch_roberta_wwm' was not found in tokenizers model name list (bert-base-uncased, bert-large-uncased, bert-base-cased, bert-large-cased,... 是我模型没有下载对吗

WuHuRestaurant commented 3 years ago

这个文件夹里面你下的什么样子

strawberrybbq commented 3 years ago

非常感谢您的回复！因为环境问题，我是使用google colab运行的 researchHub是项目的根目录，模型放在“/researchHub/BERT”文件夹下，在脚本中也改了相应BERT_dir。并且在readme的“并将 vocab.txt 中的两个 unused 改成 [INV] 和 [BLANK]（详见 processor 代码中的 fine_grade_tokenize）”这个部分，我发现vocab.txt里的内容是从[unused1]-[unused99],对此处如何改变存在一些疑问，如图：

strawberrybbq commented 3 years ago

或者是出现此问题，是模型解析有误吗？

WuHuRestaurant commented 3 years ago

把bert_config.json 改成config.json

strawberrybbq commented 3 years ago

感谢你的回复问题已解决 config.json文件名已改，除此之外，对tokenizer = BertTokenizer.from_pretrained(model_name)和bert_model = BertModel.from_pretrained(MODEL_PATH)这两个函数的参数也进行了修改。

strawberrybbq commented 3 years ago

谢谢作者！！