关于Extension on Ablation Study

Coopercoppers / PFN

EMNLP 2021 - A Partition Filter Network for Joint Entity and Relation Extraction

MIT License

171 stars 20 forks source link

关于Extension on Ablation Study #6

Closed AnWang-AI closed 3 years ago

AnWang-AI commented 3 years ago

您好，感谢您额外展示出encoding scheme相关的NER结果。基于您展示的结果，我观察到在NER的结果上Sequential >>Parallel > original。如果original model是您文中提出的PFN模型的话，这是否说明PFN的编码方式损害了NER的性能。因为Sequential方式是只将entity信息送给Relation model而不将relation信息送入entity model，而Sequential的NER结果远好于original model。甚至Parallel 也是略好于original的。但是您文中的核心论点是与以前的related work结论相反, 您证明了re是对ner有利的，这也是最吸引我的一个观点。所以我想问一下，这个Extension on Ablation Study的实验结果和您的结论是否矛盾？希望能够得到您的解答。

Coopercoppers commented 3 years ago

这只能说明NER部分还有改进的空间，比如PFN-nested就考虑到了tail信息。RE对NER有益的那两个实验并不会因为这个结果没那么好而变得不可靠。我从鲁棒性上举一个例子：比如说washington is the capital of USA. 这里washington他是在(washington, capital, USA)这个三元组里的，capital的两个实体肯定是location类型的，因此用到了RE信息的模型就不会有歧义。相反，如果washington在一个句子里他是孤立的，那对于模型来说判断它究竟是人名还是地名会更加困难一点，因此RE能帮助到NER做实体分类是一种很符合常理的认识。

AnWang-AI commented 3 years ago

感谢您的回答。但我认为这个例子是不合理的。因为entity识别模型输入的是整个句子，它并不仅利用了单个词的信息，也利用了上下文信息。即使不给模型（washington, capital, USA)这个先验的关系信息，仅仅利用上下文信息也能够识别出washington是一个地名实体。我认为不可以认为washington在一个句子里是孤立的。同时即便您认为这是一种比较intuitive的思路，在relative work以及您的工作中，都表现出目前的各种框架构造下，都不能够使得RE的信息帮助到NER，反而单向的方式在NER上效果更好。当然，这样一个讨论只是一个主观的讨论，我疑问中想指出的是您的实验结果是否证明了PFN模型的encode方式也不能够使得RE的信息帮助到NER的识别。我并没有质疑您设计的另外两个实验，我认为它们是具有启发性的。

Coopercoppers commented 3 years ago

论文 section 6.1第三段有对这一问题做过讨论，可以参考一下。

AnWang-AI commented 3 years ago

不好意思，因为6.1文中只提到ACE05，所以我以为它没有涵盖SciERC的情况。事实上，您的table 3是包含了的。想请问下，根据您的解释，如果使用Sequential的encode方式，是否In-triple的entity识别准确率下降，而out-of-triple准确率上升呢？如果能够补充类似这样的验证实验，感觉会让人得到一个非常直观的理解。

Coopercoppers commented 3 years ago

这个你可以自行进一步验证，这只是根据实验结果得出的一个假设。实验结果说明了模型确实在NER上还有改进空间，当前的模型确实是不如sequential，但是你把decoder换成PFN-nested是否还会不如sequential呢？这得进一步做实验。当然这个你也可以去自行验证一下。其他还有什么问题吗？

AnWang-AI commented 3 years ago

目前没有问题了。非常感谢您的回答。