Open YumaTsuta opened 1 month ago
実行時にMegatron-LMのコードが動くのですが、args.save_interval
を設定せずに動かすためスクリプトを改変した箇所でエラーが発生します。
この問題を解決してからPRをreadyに変更予定。
該当部分をコメントアウトすれば動きます。
新規追加するスクリプト名が hf2megatron.sh
のため、既存のmegatron -> HF形式変換スクリプト converter.sh
を megatron2hf.sh
にしても良いと思います。
This PR add model converter from hugging face format into megatron-LM format