ShomyLiu / pytorch-relation-extraction

distant supervised relation extraction models: PCNN MIL (Zeng 2015), PCNN+ATT(Lin 2016). 关系抽取
498 stars 118 forks source link

关于contextwise split #27

Open ShellingFord221 opened 5 years ago

ShellingFord221 commented 5 years ago

你好,现在大多模型在输入的时候都采取了将句子按照实体划分为3段的方法,这个时候每段的长度可以pad或者trancate到定长。假如我使用trancate的方法,那么两个实体间的部分怎么trancate呢?

比如XXX Obama XXXXXXXXXXXXX USA XXX. Obama左边和USA右边部分如果太长的话可以删掉远离实体的单词,但是Obama和USA中间的部分怎么处理呢?谢谢!

ShomyLiu commented 5 years ago

无须定长呀,因为只是对每一段取了max pooling操作,所以不需要定长。 另外,如果句子中间太长的话,一般情况,需要保留两个实体,从两个实体中间开始去掉,不过这种case比较少。