wenge-research / YAYI2

YAYI 2 是中科闻歌研发的新一代开源大语言模型,采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。(Repo for YaYi 2 Chinese LLMs)
Apache License 2.0
3.61k stars 17 forks source link

500GB预训练数据 #1

Closed Dzg0309 closed 8 months ago

Dzg0309 commented 9 months ago

repo中提供的数据集地址不可访问,请问数据集开源在什么地方呢?

wenge-research commented 8 months ago

您好,数据集目前已上传完毕,可以访问。