Geson-anko / RWKV-ReImpl

Reproducible implementation and Test of RWKV
6 stars 1 forks source link

Minimum なRWKVで学習をテスト #22

Closed Geson-anko closed 1 year ago

Geson-anko commented 1 year ago

概要

学習のための設定ファイルを追加 エラー無く学習が行えるまで修正 簡単に学習を実行するためのスクリプトなどを作成

補足

データの配置

./data
└── WikiCorpusJa
    ├── fulltext
    ├── sp_tokenizer_32k.model
    ├── sp_tokenizer_32k.vocab
    └── text

Tokenizerはここからダウンロードしてください。 https://github.com/Geson-anko/RWKV-ReImpl/issues/23#issuecomment-1537289387

WikiCorpusJa/text以下にテキストファイルを配置してください。再帰的に列挙するため構造化されていても問題ありません。

依存関係

CUDA 11.8以降でないと rfftが動きませんでした。 make docker-buildでイメージをリビルドしてください。動作確認済みです

Submit前の確認項目

参考

https://github.com/matsuo-group24-PinkTrombone/SpeechGeneration/blob/main/ExperimentProject.md