Closed Geson-anko closed 1 year ago
学習のための設定ファイルを追加 エラー無く学習が行えるまで修正 簡単に学習を実行するためのスクリプトなどを作成
./data └── WikiCorpusJa ├── fulltext ├── sp_tokenizer_32k.model ├── sp_tokenizer_32k.vocab └── text
Tokenizerはここからダウンロードしてください。 https://github.com/Geson-anko/RWKV-ReImpl/issues/23#issuecomment-1537289387
WikiCorpusJa/text以下にテキストファイルを配置してください。再帰的に列挙するため構造化されていても問題ありません。
WikiCorpusJa/text
CUDA 11.8以降でないと rfftが動きませんでした。 make docker-buildでイメージをリビルドしてください。動作確認済みです
make docker-build
pytest
make test
pre-commit run -a
make format
pre-commit
https://github.com/matsuo-group24-PinkTrombone/SpeechGeneration/blob/main/ExperimentProject.md
概要
学習のための設定ファイルを追加 エラー無く学習が行えるまで修正 簡単に学習を実行するためのスクリプトなどを作成
補足
データの配置
Tokenizerはここからダウンロードしてください。 https://github.com/Geson-anko/RWKV-ReImpl/issues/23#issuecomment-1537289387
WikiCorpusJa/text
以下にテキストファイルを配置してください。再帰的に列挙するため構造化されていても問題ありません。依存関係
CUDA 11.8以降でないと rfftが動きませんでした。
make docker-build
でイメージをリビルドしてください。動作確認済みですSubmit前の確認項目
pytest
またはmake test
コマンドでローカルにテストしましたか?pre-commit run -a
またはmake format
コマンドでpre-commit
フックを実行しましたか?参考
https://github.com/matsuo-group24-PinkTrombone/SpeechGeneration/blob/main/ExperimentProject.md