shiyybua / NER

基于tensorflow深度学习的中文的命名实体识别
1.04k stars 400 forks source link

关于target.txt文件的问题 #68

Open xsy0rival opened 5 years ago

xsy0rival commented 5 years ago

target文件我看了是对source文件做的词性标注,这个数据需要用其他nlp工具做pos得到然后一起放入训练吗?还是通过什么方法可以得到?

nvliajia commented 4 years ago

@xsy0rival 我也想知道这个,你解决了吗

xsy0rival commented 4 years ago

@xsy0rival 我也想知道这个,你解决了吗

应该是用brat标注的

nvliajia commented 4 years ago

我现在用brat标的,但是事先分词了,用anntocoll.py转换的时候里面的顺序格式都是错的,大佬知道分词后的语料怎么转换吗