ShannonAI / mrc-for-flat-nested-ner

Code for ACL 2020 paper `A Unified MRC Framework for Named Entity Recognition`
643 stars 117 forks source link

inference 遇到错误 #114

Open guantao18 opened 2 years ago

guantao18 commented 2 years ago

Given input: 这 里 的 身 体 包 括 身 体 物 质 、 身 体 部 位 、 器 官 名 称 等 。 第 九 节 二 尖 瓣 病 变 二 尖 瓣 装 置 由 瓣 环 、 瓣 叶 、 腱 索 和 乳 头 肌 等 结 构 组 成 , 任 何 一 个 或 数 个 组 成 结 构 异 常 均 可 产 生 二 尖 瓣 畸 形 , 表 现 为 瓣 膜 口 狭 窄 和 ( 或 ) 关 闭 不 全 。 Model predict: [(0, 40, '[CLS] 这 里 的 身 体 包 括 身 体 物 质 、 身 体 部 位 、 器 官 名 称 等 。 [SEP] 第 九 节 二 尖 瓣 病 变 二 尖 瓣 装 置 由 瓣', 'bod'), (0, 43, '[CLS] 这 里 的 身 体 包 括 身 体 物 质 、 身 体 部 位 、 器 官 名 称 等 。 [SEP] 第 九 节 二 尖 瓣 病 变 二 尖 瓣 装 置 由 瓣 环 、 瓣', 'bod'), (0, 46, '[CLS] 这 里 的 身 体 包 括 身 体 物 质 、 身 体 部 位 、 器 官 名 称 等 。 [SEP] 第 九 节 二 尖 瓣 病 变 二 尖 瓣 装 置 由 瓣 环 、 瓣 叶 、 腱', 'bod'), (0, 49, '[CLS] 这 里 的 身 体 包 括 身 体 物 质 、 身 体 部 位 、 器 官 名 称 等 。 [SEP] 第 九 节 二 尖 瓣 病 变 二 尖 瓣 装 置 由 瓣 环 、 瓣 叶 、 腱 索 和 乳', 'bod')]

guantao18 commented 2 years ago

@xiaoya-li @YuxianMeng @littlesulley 请问这可能是什么原因导致的?去年的issues就有这个提问。感谢!

Josson commented 2 years ago

@guantao18 我也遇到这个问题,请问解决了吗

bugface commented 2 years ago

with the pull request fix, I still have something generated from inference on the conll2003 dataset as

Model predict: [ (21, 107, 'marcello cuttitta , ivan francescato , leandro manteri , diego dominguez , francesco mazzariol , alessandro troncon , orazio arancio , andrea sgorlon , massimo giovanelli , carlo checchinato , walter cristofoletto , franco properzi curti , carlo orlandi , massimo cuttitta , giambatista croci', 'PER'), (27, 30, 'ivan francescato', 'PER') ...

where some predictions are still containing many words (only when a sentence contains many entities in the same type).