NJUNLP / TOWE

Code and data for "Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling" (NAACL2019)
MIT License
130 stars 40 forks source link

关于论文细节的一些疑问 #3

Open A-Rain opened 5 years ago

A-Rain commented 5 years ago

同学你好,这几天拜读了您的这篇Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling,我有一些细节方面的疑问,比如: 假设在一句话中出现重复的target应该怎么办呢?比如下面这个例子: To be honest, most food are delicious! And those desserts are my favourites. Besides, other green food is also popular among people. 这个例子里的target:food在文中出现了两个地方,那应该如何计算Inword和Outword LSTM呢?文中的例子好像默认一句话中target只在一处出现。

另一个疑问就是如果句中没有显式的target那应该如何解决呢,例如: The cappuccino is quite bitter and lattes is even worse. I bet other coffee is bad as well. 如果target是drinks,但是文中并没有出现,那应该如何计算呢?

可能文中有些细节我没读到位导致了这些困惑,等待您的解答~

yilifzf commented 5 years ago

感谢您的兴趣。

  1. target并不是只作为词输入的,而是会给具体的位置,所以在模型上会按照输入的位置来决定。具体的位置涉及到标注问题,target标注我们是按照semeval原始的标注来的,对于同一个target 词出现多次,情感词的选择上我们会根据具体语义来判断,有些时候不同位置的同一个target词会共享所有情感词,有些时候不会,具体需要看语法和上下文来判断是否有描述关系。此外这个例子,第二个target有可能是greed food,不过target标注我们原则是保持不动,所以要看semeval原始的标注。
  2. 您讲的这个现象可能和一般认为的target含义不太一样,target一般就是认为是句子中出现的实体,drinks应该指抽象的aspect,这是另一个问题了。