shiyybua / NER

基于tensorflow深度学习的中文的命名实体识别
1.04k stars 400 forks source link

错误的预测结果:全部为O #72

Open gaodan223 opened 5 years ago

gaodan223 commented 5 years ago

新华社 (b'O') 北京 (b'O') 9 (b'O') 月 (b'O') 11 (b'O') 日电 (b'O') 第二十二届 (b'O') 国际 (b'O') 检察官 (b'O') 联合会 (b'O') 年会 (b'O') 暨 (b'O') 会员 (b'O') 代表大会 (b'O') 11 (b'O') 日 (b'O') 上午 (b'O') 在 (b'O') 北京 (b'O') 开幕 (b'O') 。 (b'O') 国家 (b'O') 主席 (b'O') 习近平 (b'O') 发来 (b'O') 贺信 (b'O') , (b'O') 对 (b'O') 会议 (b'O') 召开 (b'O') 表示祝贺 (b'O') 。 (b'O') (1)词向量是word2vec训练的,还需要处理吗? (2)source_vocab.txt文件是这样的:b'' b'\xef\xbc\x8c' b'\xe7\x9a\x84' b'\xe3\x80\x82' b'-' b'\xe5\xb9\xb4' b"'" b'\xef\xbc\x88' b'\xef\xbc\x89' b'}' b'\xe3\x80\x81' b'.' b'\xe6\x9c\x88' b')' b'(' b'\xe6\x97\xa5' b'\xe5\x9c\xa8' b'\xef\xbc\x9a' b'\xe6\x98\xaf' 是正确的吗?

1013801464 commented 4 years ago

我也遇到了同样的问题

1013801464 commented 4 years ago

后来我把src_vocab_file删了, 让程序重新生成就没事了

woxiangquca commented 4 years ago

请问楼主训练用了多久呀 我这个跑了好长时间。。。

zhouhongzhao commented 4 years ago

后来我把src_vocab_file删了, 让程序重新生成就没事了

我把src_vocab_file删掉还是没解决,请问有可能是哪里的问题?