litagin02 / Style-Bert-VITS2

Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles.
GNU Affero General Public License v3.0
771 stars 99 forks source link

error during training #144

Closed kouji1009 closed 5 months ago

kouji1009 commented 5 months ago

Screenshot 2024-06-18 115649 解決済みの質問に似たようなエラーの対処法があり試してみたんですが、上手くいきません。 一度、rawとesd.listのみにしてからトレーニングを始めても治りません。

使っているesd.listの形式はこのようになっています。

image
OzoneAsai commented 5 months ago

事前処理...ボタンを押した後(処理が完了)のesd.listを見せてください。

kouji1009 commented 5 months ago
image
kouji1009 commented 5 months ago
image

公式のこちらのコードを実行した後このようなデータが得られました。

OzoneAsai commented 5 months ago

カレントディレクトリが遠くて笑える...笑える? カレントディレクトリをもっと深いところ、App.batやapp.pyがある場所にしてやってみてください。(これが私のこだわりに他ならない可能性はあるが、colabでも!cd で移動できる...) まあ、この状態で一度トレーニングしていただいても..?

kouji1009 commented 5 months ago

一度新しいnotebookでやり直した後に言われたことをやってみたんですが、変わらずエラーが出ています。

image
litagin02 commented 5 months ago

標準スタイルベクトルの生成のところでエラーになっているようです。 wavs/フォルダの音声ごとに.npyファイルは存在するでしょうか?recitation001.wav.npyなど。

litagin02 commented 5 months ago

またこのrecitation001.wav.npy等のファイルはpreprocess_allがあるセルで自動で生成されるはずなのですが、そこの出力はどのようになっているでしょうか。

kouji1009 commented 5 months ago

wavsフォルダーには.npyファイルではなく.wav の形式のままになっています。

image
litagin02 commented 5 months ago

ありがとうございます。wavファイルがあるのはよいのですが、本当はそこに「recitation001.wav.npy」等のファイルも出るのですが、それはないですか?

また、preprocess_allの結果の出力を教えていただくことはできるでしょうか?

litagin02 commented 5 months ago

今気づきましたが、見せていただいた画像では音声ファイルはrecitation_1.wavですが書き起こしではrecitation001.wavとなっていて、そこの不一致でファイルが出てきていない可能性もありますので、書き起こしかファイル名を修正して試していただけないでしょうか。

kouji1009 commented 5 months ago

ファイル名を修正してみたら学習始まりました。 ありがとうございます!