FlagOpen / FlagEmbedding

Retrieval and Retrieval-augmented LLMs
MIT License
7.82k stars 571 forks source link

Visualized_BGE chinese Train #1150

Open xueyedamo521 opened 1 month ago

xueyedamo521 commented 1 month ago

您好,非常好的工作!请问VISTA-S2 dataset的样本都是英文描述,怎么训练的Multilingual版本呢?特别是中文的支持。

JUNJIE99 commented 1 month ago

您好,感谢你的关注。

我们简单地使用机器翻译将VISTA-S2的数据翻译为中文,然后加入到了Visualized-BGE-M3的第二阶段训练中得到的。