wangyuxinwhy / uniem

unified embedding model
Apache License 2.0
814 stars 61 forks source link

m3e-large数据集的相关问题 #118

Open zysNLP opened 8 months ago

zysNLP commented 8 months ago

请问训练m3e-large数据集是和small、base一样都是2200万中文数据集吗?还是说m3e-large数据集的量会多一些,large大概用了多少数据量?谢谢

wangyuxinwhy commented 8 months ago

嗯嗯,都是同样的数据集,只是模型参数规模不一致~