Open 258863 opened 3 months ago
你好,图中的那个是支持训练的时候支持json传入参数,例如 python run.py argument.json argument.json如下
{
"batch_size": 1,
"learning_rate": 1e-4
}
你好,图中的那个是支持训练的时候支持json传入参数,例如 python run.py argument.json argument.json如下
{ "batch_size": 1, "learning_rate": 1e-4 }
但是数据大概40g一次性加载过程中会爆内存,预估加载需要300多g内存,所以除了json数据集还支持其他格式吗比如jsonl
请问是哪个模型?是否开启了mixtoken,如果开启了,可以关掉试试
原来是这样写的