关于论文细节的一些疑问

NJUNLP / TOWE

Code and data for "Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling" (NAACL2019)

MIT License

130 stars 40 forks source link

同学你好，这几天拜读了您的这篇Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling，我有一些细节方面的疑问，比如：假设在一句话中出现重复的target应该怎么办呢？比如下面这个例子： To be honest, most food are delicious! And those desserts are my favourites. Besides, other green food is also popular among people. 这个例子里的target:food在文中出现了两个地方，那应该如何计算Inword和Outword LSTM呢？文中的例子好像默认一句话中target只在一处出现。

另一个疑问就是如果句中没有显式的target那应该如何解决呢，例如： The cappuccino is quite bitter and lattes is even worse. I bet other coffee is bad as well. 如果target是drinks,但是文中并没有出现，那应该如何计算呢？

可能文中有些细节我没读到位导致了这些困惑，等待您的解答~

感谢您的兴趣。

target并不是只作为词输入的，而是会给具体的位置，所以在模型上会按照输入的位置来决定。具体的位置涉及到标注问题，target标注我们是按照semeval原始的标注来的，对于同一个target 词出现多次，情感词的选择上我们会根据具体语义来判断，有些时候不同位置的同一个target词会共享所有情感词，有些时候不会，具体需要看语法和上下文来判断是否有描述关系。此外这个例子，第二个target有可能是greed food，不过target标注我们原则是保持不动，所以要看semeval原始的标注。
您讲的这个现象可能和一般认为的target含义不太一样，target一般就是认为是句子中出现的实体，drinks应该指抽象的aspect，这是另一个问题了。

NJUNLP / TOWE

关于论文细节的一些疑问 #3