Closed chenjinxinlove closed 2 months ago
我想使用我自己的代码库,用text类型的文件,来预训练一下。但是现在在create_datasets时报错
train_dataset, eval_dataset = create_datasets(tokenizer, args)
希望官方能提供一个demo,类似starcoder2
使用了LLaMA-Factory完成了pt
我想使用我自己的代码库,用text类型的文件,来预训练一下。但是现在在create_datasets时报错
希望官方能提供一个demo,类似starcoder2