Closed zyh3826 closed 1 year ago
事件提取我没写,写过关系提取,指标是接近的,回头我看下你的脚本
你好,dev的最优f1=72.5%,我想问下苏神文章里面的指标是不是提交的test的指标,你有尝试提交过吗?
事件提取我没写,写过关系提取,指标是接近的,回头我看下你的脚本
感谢,关系提取的我看了,我就是仿照你那个改的
事件抽取我复现过, 我用chinese-roberta-wwm-base模型训练百度DuEE数据集,事件级别的f1只有44左右, 这是因为事件级别的指标太难,需要每个论元的边界都对才算对,这很正常的,但是正常的评判指标都是按照论元的字级别的评判方式的.
事件抽取我复现过, 我用chinese-roberta-wwm-base模型训练百度DuEE数据集,事件级别的f1只有44左右, 这是因为事件级别的指标太难,需要每个论元的边界都对才算对,这很正常的,但是正常的评判指标都是按照论元的字级别的评判方式的.
我这边跑下来看,dev上的event_level的f1也是44%
你好,dev的最优f1=72.5%,我想问下苏神文章里面的指标是不是提交的test的指标,你有尝试提交过吗?
我复现的73.1%,跑了原始代码也是这个点,估计他提交的是test指标
好的,那暂时应该没啥问题
科学空间脚本地址:https://github.com/bojone/GPLinker/blob/main/duee_v1.py bert4torch版本:0.2.5 torch版本:1.7.1 python版本:3.8 我自己复现后发现最后f1少了10个点,单步调试一直没找到问题,下面是我的脚本