-
很多句子切分和原数据集不一样,一般不影响NER任务,但主要是有很多句变成一句的,比如第三句有300多个字,后面还有两千多字一句的,直接做预测就截断了,用来和论文结果比较还需要自己预处理。
-
File "D:\nlp\ChineseNER\loader.py", line 110, in
tags = [tag_to_id[w[-1]] for w in s]
KeyError: 'S-ORG'
-
请问训练自己的数据集,是按照data/train/corpus/下面的train.json格式来制作自己的数据集来训练吗?
想问一下,您当时只使用了train.json中的数据进行训练,还是使用了整个ChineseNER外加自己的数据?
-
您好,在跑BILSTM+CRF的时候程序出现如下错误
Traceback (most recent call last):
File "main.py", line 126, in
main(args)
File "main.py", line 109, in main
framework.train(train_dataset, dev_dataset, mo…
-
博主,您好!想问一下博主得到的预训练模型所用的中文ner数据是ChineseNER吗?也即这个链接https://github.com/zjy-ucas/ChineseNER
-
博主您好,请问您是使用这个链接https://github.com/zjy-ucas/ChineseNER的数据进行预训练得到的预训练模型吗?因为自己训练后得到的和博主您网盘提供的有所差别?
-
我选择了版本0.2.1,epoch是100,最后evaluate的结果如下:
precision recall f1-score support
LOC 0.6957 0.6741 0.6847 2384
PER 0.7946 0.6193 0.6961 1337
O…
-
你好,我在测试的时候输入文本中包含英文的时候就会出现下面的错误,请问怎么解决呢,非常感谢
tensorflow.python.framework.errors_impl.InvalidArgumentError: indices[0,0] = 4026 is not in [0, 4026)
[[{{node bilstm_crf/embedding_lookup}} = GatherV2…
-
Traceback (most recent call last):
File "model.py", line 505, in
model.train()
File "model.py", line 284, in train
self.train_data = BertDataUtils(tokenizer, batch_size=5)
File "C:…
-
ChineseNER/data/renMinRiBao/data_renmin_word.py中的85行到88行,为什么会只保留numNotO!=0的linedata?