Open onep2p opened 6 years ago
LOC: location, TIME: time, ORG: organization, CRIME: crime, PER: person, ROLE:role, LAW:law
@shiyybua 请问您当时采用的训练文件就是resource文件夹下的的source.txt的数据量吗?还是说source.txt只是一个示例呢?
@summerHaha source.txt只是一个示例, 你可以把它换成自己的语料。
@shiyybua 谢谢回答!您这份代码是基于词的标注,想请问一下,对于中文来说,基于字的ner 和 基于词的ner 有什么区别呢?刚刚接触这部分,看到网上好像多数是基于字的。 另外,您可否分享一下完整的训练集文件呢?邮箱:1922971835@qq.com 非常感谢~~~
@shiyybua 另外还想问下 您训练用时多少呢?
@summerHaha 区别不大,具体的https://zhuanlan.zhihu.com/p/29412214 里面有讲。训练文件其他issue里面也有说。用时的话,30分钟左右把,跟GPU的型号和训练语料有关。
@shiyybua 请问一下:target.txt中对实体识别标签的设计可否可以更改?标签设计规则有什么要求吗?可否对标签设计说明一下,或者分享一下相关资料,谢谢 2507161048@qq.com
target.txt的标注是怎么来的啊,手工标注的么?有没有比较方便的工具啊?谢谢
@shiyybua 您好,想问下 O 是Object的意思?最后预测结果中 O 的最多
@shiyybua 您好,想问下 O 是Object的意思?最后预测结果中 O 的最多
表示Outside,不属于上述任何一类。所以单独列出
@shiyybua 你好,求一份训练文件1576752434@qq.com,谢谢!
请问为什么还有前缀BI呢?不是按词来作为实体了吗,没有begin和in的区别了吧?没太懂,希望有解释。
O B-LOC I-TIME B-ORG I-CRIME B-PER I-ORG B-TIME B-ROLE B-CRIME I-PER I-LAW I-LOC I-ROLE B-LAW
具体有这些类别,但具体表示的什么,大神可以做个备注吗?