MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。
3.49k
stars
246
forks
source link
百度网盘下载的文件解压缩需要密码 #49
Closed
ZeyuTeng96 closed 10 months ago
解压缩百度网盘下载的文件需要密码,解压的时候,显示‘links.txt’受密码保护,请问这个密码是什么,为什么解压都需要密码呢