Open lumiere-ml opened 7 months ago
想问下,sky数据集很大,整体下载有500G左右,麻烦是否能介绍下,模型训练用了哪些数据,总共多少tokens?
下载了前20个
这样会不会导致数据有偏之类的,请问下选择前20个和随机20个 影响大不
想问下,sky数据集很大,整体下载有500G左右,麻烦是否能介绍下,模型训练用了哪些数据,总共多少tokens?