SmartLi8 / stella

text embedding
Apache License 2.0
134 stars 6 forks source link

长文档评测问题 #9

Open afalf opened 11 months ago

afalf commented 11 months ago

您好,想问一下长文档的数据集评测的corpus是什么呢,是只有提供的数据集中所有的“txt2”么,还是原始数据集?可以提供一下long eval相关的脚本么,感谢🙏

DunZhang commented 10 months ago

@afalf 你好,是只有提供的数据集中所有的“txt2”,脚本是常规计算recall@k的代码,我这边代码集成度比较高,不方便直接提供