shiyybua / NER

基于tensorflow深度学习的中文的命名实体识别
1.04k stars 400 forks source link

标注类型问题 #4

Open onep2p opened 6 years ago

onep2p commented 6 years ago

O B-LOC I-TIME B-ORG I-CRIME B-PER I-ORG B-TIME B-ROLE B-CRIME I-PER I-LAW I-LOC I-ROLE B-LAW

具体有这些类别,但具体表示的什么,大神可以做个备注吗?

shiyybua commented 6 years ago

LOC: location, TIME: time, ORG: organization, CRIME: crime, PER: person, ROLE:role, LAW:law

summerHaha commented 6 years ago

@shiyybua 请问您当时采用的训练文件就是resource文件夹下的的source.txt的数据量吗?还是说source.txt只是一个示例呢?

shiyybua commented 6 years ago

@summerHaha source.txt只是一个示例, 你可以把它换成自己的语料。

summerHaha commented 6 years ago

@shiyybua 谢谢回答!您这份代码是基于词的标注,想请问一下,对于中文来说,基于字的ner 和 基于词的ner 有什么区别呢?刚刚接触这部分,看到网上好像多数是基于字的。 另外,您可否分享一下完整的训练集文件呢?邮箱:1922971835@qq.com 非常感谢~~~

summerHaha commented 6 years ago

@shiyybua 另外还想问下 您训练用时多少呢?

shiyybua commented 6 years ago

@summerHaha 区别不大,具体的https://zhuanlan.zhihu.com/p/29412214 里面有讲。训练文件其他issue里面也有说。用时的话,30分钟左右把,跟GPU的型号和训练语料有关。

INC3527 commented 6 years ago

@shiyybua 请问一下:target.txt中对实体识别标签的设计可否可以更改?标签设计规则有什么要求吗?可否对标签设计说明一下,或者分享一下相关资料,谢谢 2507161048@qq.com

Weigoss commented 6 years ago

target.txt的标注是怎么来的啊,手工标注的么?有没有比较方便的工具啊?谢谢

chxt6896 commented 6 years ago

@shiyybua 您好,想问下 O 是Object的意思?最后预测结果中 O 的最多

luanles commented 6 years ago

@shiyybua 您好,想问下 O 是Object的意思?最后预测结果中 O 的最多

表示Outside,不属于上述任何一类。所以单独列出

jiaqiyu543 commented 5 years ago

@shiyybua 你好,求一份训练文件1576752434@qq.com,谢谢!

tangdai0228 commented 4 years ago

请问为什么还有前缀BI呢?不是按词来作为实体了吗,没有begin和in的区别了吧?没太懂,希望有解释。