PaddlePaddle / Research

novel deep learning research works with PaddlePaddle
Apache License 2.0
1.72k stars 788 forks source link

ACL2022-DuLeMon中首次对话的原始数据能否公开 #279

Open aa452948257 opened 2 years ago

aa452948257 commented 2 years ago

PersonaExtractor从首次对话中提取相关的个性化信息,但是我发现你们公开的数据中,没有一次对话的原文,取之而代的是已经提取好的个性化信息

ruleGreen commented 2 years ago

+1

cingtiye commented 2 years ago

PersonaExtractor从首次对话中提取相关的个性化信息,但是我发现你们公开的数据中,没有一次对话的原文,取之而代的是已经提取好的个性化信息

你可以参考一下这个知乎理解一下PE的训练和用途: https://zhuanlan.zhihu.com/p/538792037

ZubinGou commented 2 years ago

谢谢关注!

开源的数据是全量的数据,不存在你讲的首次对话的原始数据,因为首次交互是假想发生的,让记忆中存储了提取好的双方 persona。