Closed YumaTsuta closed 1 month ago
当初は安全面に振り切って TOTAL_TOKEN_SIZE
までチェックしてましたが、コードやノードが正しく動くことを前提にしてレプリカノードで $DATA_CONFIG
を作成しないようにするだけなら sleep
するだけでも良い気はしてきました
if [ "$OMPI_COMM_WORLD_RANK" -eq 0 ]; then
# Prepare data config to load
python3 "${SCRIPT_ROOT}/megatron_data_formatter.py" "${SCRIPT_DIR}/data_config.yaml" >"$DATA_CONFIG" 2>"$DATA_SUMMARY"
else
sleep 3
fi
This PR add script of experiment C. (use taken and warp dataset only as Ja dataset) This PR also includes script fix that disable replica nodes to create data config.