universal-ie / UIE

Unified Structure Generation for Universal Information Extraction
900 stars 99 forks source link

uie-char-small是在什么数据集上预训练的? #30

Closed zdgithub closed 2 years ago

zdgithub commented 2 years ago

请问下中文版的uie-char-small是在什么数据集上预训练的?

luyaojie commented 2 years ago

用了两种远距离监督的文本-结构数据:一种是百科的链接数据,另一种是三元组和文本远距离监督的对齐数据。

xxllp commented 2 years ago

后面有没有开放更大中文模型的可能

luyaojie commented 2 years ago

uie-char-small主要是作为CCKS的比赛基线使用,未来可能会考虑开放。

zdgithub commented 2 years ago

好的,感谢!