ksOAn6g5 / TaiSu

TaiSu(太素)--a large-scale Chinese multimodal dataset(亿级大规模中文视觉语言预训练数据集)
Other
172 stars 11 forks source link

请问generated caption和web caption哪种适合用于多模态大模型的预训练呢,两者的主要内容差异在哪,都可以用吗 #10

Open Yang-bug-star opened 3 months ago