Alibaba-NLP / Multi-CPR

[SIGIR 2022] Multi-CPR: A Multi Domain Chinese Dataset for Passage Retrieval
170 stars 18 forks source link

请问paper中的General Domain Dataset在哪里?在data文件夹下面没看到 #5

Closed xukefaker closed 1 year ago

xukefaker commented 2 years ago

谢谢!

dingkun-ldk commented 2 years ago

general domain的数据是从dureader数据转换得到的, dureader数据集可以参考 https://ai.baidu.com/broad/leaderboard?dataset=dureader

xukefaker commented 2 years ago

general domain的数据是从dureader数据转换得到的, dureader数据集可以参考 https://ai.baidu.com/broad/leaderboard?dataset=dureader

那请问你们有相应的转换工具吗?