WThirteen / BiLSTM-CRF

中文命名实体识别
MIT License
1 stars 0 forks source link

语句预测报错 #1

Open liusihu-source opened 5 days ago

liusihu-source commented 5 days ago

请问up预测报错是什么原因呢?

Traceback (most recent call last): File "F:\Project\NER\BiLSTM-CRF-master\train.py", line 158, in cn.predict("寒武纪在北京举办2022春季专场招聘会") File "F:\Project\NER\BiLSTM-CRF-master\train.py", line 99, in predict input_vec.append(word2id['[unknown]']) KeyError: '[unknown]'

75ef75aca4b795fb4f84e7d8c0720a06

WThirteen commented 5 days ago

请再给一些报错信息,方便定位找到错误。

liusihu-source commented 5 days ago

下载了阿里云盘中的train.txt 和 test.txt , 然后我把config.py内部的max_epoch 调小了些,运行train.py文件时候,报错如下图。 我找到了word2id最初是在read_file_txt.py中的load_text()方法中,不过不清楚具体原因是否和这个有关。NER小白 5127680612b07b142aeeb11a003226ed

WThirteen commented 5 days ago

可以尝试预测其他的文本,太久没有用这个项目了。

cn = ChineseNER()
cn.predict()

现在还在跑模型 ,到预测这部分还会很久。 {A93866D7-E694-4993-BCA4-8AD4594ECEF7}

WThirteen commented 5 days ago

可能是数据集中都没有出现 “寒武纪在北京举办2022春季专场招聘会”这句话, 可以使用数据集中出现的字符试一下。如 “浙江省”、“义乌长春路”等

liusihu-source commented 5 days ago

好的,谢谢 😆