Closed xxllp closed 2 years ago
没有。。您可以从入口单步调试一下
而且我感觉这个工具 换一个新的数据需要设置的东西太多了
而且我感觉这个工具 换一个新的数据需要设置的东西太多了
可以详细说下吗?欢迎PR
现在的 event type 里面的类生成 是否可以自动化一些
不然新的数据都需要加个类 事件类型一多 写起来很恶心 这个明显属于扩展性的问题
嗯啊,这部分主要是延续了Doc2EDAG的风格。拓展性确实是个问题。在Data/trigger.py
中挑选伪触发词时其实会自动生成相关的template。搭配一些自动化处理的脚本,所以只要数据集是现成的,一般不会手写template。
对这个ptpcg 论文里面还有一些疑问: 1.这个伪触法词组合是提前计算好的 后续在哪里用到了这个 目前只是看到了 trigger个数有限制
上面 1和2 这里面的伪触法词 是一个意思的话 没太理解是怎么对应上的 还是必须到最后才能确定?
嗯嗯好的。
好的~~ 谢谢 还有个问题 开始的ner 模型 实体的类型只是某些很粗的类型 而不是论元的类型对吧。 但是如果用粗的类型 应该会又标注不完全的可能 这种是不是也会产生一些干扰
嗯对的,是实体类型,比如人名机构时间什么的。如果更换数据集,且数据集里没提供这种实体类别的话,可以用论元角色作为实体类型。 用粗粒度的标注方法应该还好。如果用论元角色作为类型,可能会有标注不完全的可能。会造成一些干扰。所以可以用正则或其它方法对实体做个补全,在PTPCG上是有一些提升的。
了解 大体思路还是可以的~~就是感觉这块跟后面role 分类有些冗余了
如果伪触发词数是1的话还好。数量大于1的时候还是必须要做role分类的,不过这里确实少个约束。
如果伪触发词数是1的话还好。数量大于1的时候还是必须要做role分类的,不过这里确实少个约束。
这里role分类是指伪触发词的role分类,普通实体role分类肯定是要做的。
这种dee的模型对文件长度不是很长的文本效果也能有保障吗
这种dee的模型对文件长度不是很长的文本效果也能有保障吗
缺乏实验结果。文本长度不长的一般都有触发词,用不上这种无触发词的模型。不过PTPCG的伪触发词可以作为一种补充,在篇章事件抽取任务上来看是有提升的。
论文里面几个模型的效果对比 都是复现来的 但是我看不少都比算法原始的论文的指标要低
不知道是否有多此随机取平均值啥的保障结果的可靠
论文里面几个模型的效果对比 都是复现来的 但是我看不少都比算法原始的论文的指标要低 不知道是否有多此随机取平均值啥的保障结果的可靠
还好吧,有的高有的低。我们想要做的分析之前的论文里没有给出明确的结果,所以只能跑他们的代码了。由于没有那么多的资源去跑不同随机种子的baseline(一个模型就要4卡跑一周),所以只汇报了官方代码中固定种子的结果。
还有个不太明白的地方 实体相似度矩阵 训练得到 实体之间的连接矩阵
那个真实的gt 是从哪里来的? 是从重要性role 来的还是?
您是指金标连接矩阵吗?就是金标的剪枝完全图
对的 这个金标的剪枝完全图 又是从哪里来的
嗷嗷。是按论文里介绍的方法构建的。arxiv版论文中的Pruned complete graph building
小节里有说明。
ok 看了下 大概是懂了 但是 这块如果遇到那种一个实体出现在多个段落的不同位置 , 这个时候计算相似度的时候 取哪个位置的entity representions ?还是取了个啥平均池化
您好,论文的Entity Representation
小节里有介绍的。
看了下论文里面的对比实验 在多事件的数据上 本论文的效果会差很多
嗯,是要差一点。我们也在future discussion里给出了一些量化的错误分析结果。是需要研究的可提升点。
还有个问题 Event Records Generation 里面的event type 和combinations 对应 看直接用的笛卡儿积
是对每个事件类型分别对 combinations 进行分类是吗
是不是这块导致在多事件下效果比较一般的呢~~
还有个问题 Event Records Generation 里面的event type 和combinations 对应 看直接用的笛卡儿积 是对每个事件类型分别对 combinations 进行分类是吗 是不是这块导致在多事件下效果比较一般的呢~~
好的 ,你的意思是在相似图预测这块精准性有些问题?还是在预测后的图拆解这块呢 我想后面做一些效果提升的工作
相似度预测可以继续尝试一下。论文future discussion一节中有更多的说明。欢迎您cite我们的工作~
如果有其它问题,可以新开issue。针对前面的代码结构问题,欢迎PR~
Agreement
x
to check the agreement items.README.md
.Problem
我想单独看这个算法的相关的部分内容 不看其他的 是否有历史的分支项目代码
Environment
Full Log