Spico197 / DocEE

🕹️ A toolkit for document-level event extraction, containing some SOTA model implementations.
https://doc-ee.readthedocs.io/
MIT License
234 stars 36 forks source link

关于ptpcg论文的一些问题 #87

Open afbui2821q893 opened 4 months ago

afbui2821q893 commented 4 months ago

作者您好,我最近阅读了您的ptpcg这篇论文,对您的这种轻量级的且不需要触发词的事件抽取模型很感兴趣,但是我在阅读过程中有一些困惑:

1718186434062 按照这里的公式计算出来的实体相似度矩阵不应该是对称矩阵吗,为什Fig2里的是不对称的?

您论文中提到Ne(R) is the number of event records that at least one corresponding argument of R is not NULL, and N(i) is the number of total records of ti。难道不是所有的event record满足这个条件吗

Spico197 commented 4 months ago

嗨您好,感谢您对本工作的关注。

  1. 这里不是对称矩阵。剪枝完全图是有向图,所以需要区分方向。
  2. 不是所有records都满足,因为有些事件实例中的某些要素角色并没有具体的要素与之对应。简单来说就是缺少事件要素,比如文本中可能没有出现具体的“质押金额”。
afbui2821q893 commented 4 months ago

嗨您好,感谢您对本工作的关注。

  1. 这里不是对称矩阵。剪枝完全图是有向图,所以需要区分方向。
  2. 不是所有records都满足,因为有些事件实例中的某些要素角色并没有具体的要素与之对应。简单来说就是缺少事件要素,比如文本中可能没有出现具体的“质押金额”。

感谢您的回复

计算这个矩阵的时候,按照这个公式 b8ebde955549c7ec84436d53c3339c2 不都是da维的向量吗?这样算下来Aj,i 和Ai,j不应该是相同的吗?那这个矩阵不应该是对称的吗

这个Ne(R)是至少一个事件论元角色不为空的event record数量,不就是只要有一个事件论元角色能在document找到对应的argument就可以了吗,这个条件所有record都满足啊,因为如果一条record中所有的argument role都没有在文中出现,那这个record就不存在了呀

Spico197 commented 4 months ago
  1. 参数是不一样的,一个是 $W_s$ ,一个是 $W_e$
  2. 这里的 $\mathcal{R}$ 不是指所有的要素角色,而是想要判断为伪触发词的事件角色候选集合,比如 “破产清算”的要素角色为:["公司名称", "公告时间", "受理法院", "裁定时间", "公司行业"],首先找一个候选集合["公司名称", "公告时间", "受理法院"]作为伪触发词组候选,计算existence,就可以计算这三个角色对应的要素是否同时存在/不存在。它们都不出现的时候,其它两个角色["裁定时间", "公司行业"]会有对应的要素的,所以record仍然存在
afbui2821q893 commented 4 months ago
  1. 参数是不一样的,一个是 Ws ,一个是 We
  2. 这里的 R 不是指所有的要素角色,而是想要判断为伪触发词的事件角色候选集合,比如 “破产清算”的要素角色为:["公司名称", "公告时间", "受理法院", "裁定时间", "公司行业"],首先找一个候选集合["公司名称", "公告时间", "受理法院"]作为伪触发词组候选,计算existence,就可以计算这三个角色对应的要素是否同时存在/不存在。它们都不出现的时候,其它两个角色["裁定时间", "公司行业"]会有对应的要素的,所以record仍然存在

明白了,感谢您的回复