allanj / ner_incomplete_annotation

125 stars 33 forks source link

9小类的实体类别咨询 #13

Open kcxz opened 2 weeks ago

kcxz commented 2 weeks ago

从天池 https://tianchi.aliyun.com/dataset/108758 而来 数据集中只看到了['B-HCCX', 'B-HPPX', 'B-MISC', 'B-XH', 'I-HCCX', 'I-HPPX', 'I-MISC', 'I-XH', 'O'],只有4个大类的实体标签,但是天池中说此数据集中有9个小类的实体标签,请问9个小类的实体标签有没有

allanj commented 2 weeks ago

这个是当时做过的一些 预处理。但我不确定是否能公开,建议邮件咨询 论文中 https://aclanthology.org/N19-1079.pdf 阿里相关同学哈

Xie pengjun or Ruixue Ding

wuxiaohui0 commented 1 week ago

从天池 https://tianchi.aliyun.com/dataset/108758 而来 数据集中只看到了['B-HCCX', 'B-HPPX', 'B-MISC', 'B-XH', 'I-HCCX', 'I-HPPX', 'I-MISC', 'I-XH', 'O'],只有4个大类的实体标签,但是天池中说此数据集中有9个小类的实体标签,请问9个小类的实体标签有没有

您好,这个您是直接使用的四类还是咋样处理的。

allanj commented 1 week ago

论文上是直接使用这四类噢

wuxiaohui0 commented 1 week ago

论文上是直接使用这四类噢

那我可以直接使用这四类然后用我的模型来跑吧

allanj commented 1 week ago

可以

wuxiaohui0 commented 1 week ago

可以

感谢

wuxiaohui0 commented 1 week ago

可以

感谢

这四个类中文名字是什么,

kcxz commented 1 week ago

可以

感谢

这四个类中文名字是什么,

HCCX: 商品 product (e.g., Product Description, Core Product) MISC: 产地? Miscellaneous information (e.g., product Specification, Location, Person, Literature ) HPPX: 品牌  brand (e.g., Brand Description, Core Brand) HX/XH: 规格 pattern (e.g., Model Type)