Open Tendo33 opened 1 year ago
在 OneAutoTest 里面有三个 branch :https://github.com/Oneflow-Inc/OneAutoTest/branches:
分别是 megatron_script_tecent , megatron_script_huoshan , megatron_script_sahngtang , 对应了腾讯云,火山云,商汤大装置, 三个平台所适配的脚本 训练脚本所在的路径位于 OneAutoTest/onebench/libai/ ,其中有四个脚本需要特别注意和使用: 下载时请特别注意使用的分支!
args_train.sh
此脚本为 libai 主要的训练脚本,功能为定义训练所需的参数,将参数传入训练启动文件
run_libai_gpt.sh
此脚本主要为配置 libai 训练所需的环境,包括安装 One Flow,Libai, 下载所需的数据集,以及调用 args_train.sh 发起训练,脚本中只设置了两个例子case,自定义需求可根据参数含义进行修改
megatron_args_pretrain_gpt2.sh
此脚本为 Megatron主要的训练脚本,训练参数已经对齐 libai,
run_megatron_ml_gpt.sh
此脚本为配置 Megatron 训练所需的环境,包括下载 Megaton,数据集,以及调用 megatron_args_pretrain_gpt2 发起训练,脚本中只设置了一个例子case,自定义需求可根据参数含义进行修改
在 OneAutoTest 里面有三个 branch :https://github.com/Oneflow-Inc/OneAutoTest/branches:
分别是 megatron_script_tecent , megatron_script_huoshan , megatron_script_sahngtang , 对应了腾讯云,火山云,商汤大装置, 三个平台所适配的脚本 训练脚本所在的路径位于 OneAutoTest/onebench/libai/ ,其中有四个脚本需要特别注意和使用: 下载时请特别注意使用的分支!
args_train.sh
此脚本为 libai 主要的训练脚本,功能为定义训练所需的参数,将参数传入训练启动文件
run_libai_gpt.sh
此脚本主要为配置 libai 训练所需的环境,包括安装 One Flow,Libai, 下载所需的数据集,以及调用 args_train.sh 发起训练,脚本中只设置了两个例子case,自定义需求可根据参数含义进行修改
megatron_args_pretrain_gpt2.sh
此脚本为 Megatron主要的训练脚本,训练参数已经对齐 libai,
run_megatron_ml_gpt.sh
此脚本为配置 Megatron 训练所需的环境,包括下载 Megaton,数据集,以及调用 megatron_args_pretrain_gpt2 发起训练,脚本中只设置了一个例子case,自定义需求可根据参数含义进行修改