Open qinglongheu opened 5 months ago
你好,我在跑中文数据集,遇到这样的问题在prepro.py中的read_docred函数中出现这样的断言:assert len(relations) == len(entities) * (len(entities) - 1), 请问这个断言的目的是?
@qinglongheu 您好,此断言是为了确保关系标签的数量(len(relations)
)与实体组的数量(文章中有len(entities)
个实体时,实体组的数量是len(entities) * (len(entities) - 1)
)相同。如果此断言没有通过,不妨确认prepro.py的L.215 - L.239是否存在向列表relations
中漏添或多添实体组的情况。
希望这能解决您的问题。
@qinglongheu 您好,感谢您对本项目的兴趣!
本项目并未针对中文数据集进行测试,但只要按照格式备齐以下文件,应该可以在中文数据集上运行:
meta/
目录下(可以参考这个目录):(relation label, relation id)
的键值对;(relation name, relation label)
的键值对。希望这能解决您的问题,谢谢!