Closed kouji1009 closed 5 months ago
事前処理...ボタンを押した後(処理が完了)のesd.listを見せてください。
公式のこちらのコードを実行した後このようなデータが得られました。
カレントディレクトリが遠くて笑える...笑える? カレントディレクトリをもっと深いところ、App.batやapp.pyがある場所にしてやってみてください。(これが私のこだわりに他ならない可能性はあるが、colabでも!cd で移動できる...) まあ、この状態で一度トレーニングしていただいても..?
一度新しいnotebookでやり直した後に言われたことをやってみたんですが、変わらずエラーが出ています。
標準スタイルベクトルの生成のところでエラーになっているようです。
wavs/フォルダの音声ごとに.npyファイルは存在するでしょうか?recitation001.wav.npy
など。
またこのrecitation001.wav.npy
等のファイルはpreprocess_all
があるセルで自動で生成されるはずなのですが、そこの出力はどのようになっているでしょうか。
wavsフォルダーには.npyファイルではなく.wav の形式のままになっています。
ありがとうございます。wavファイルがあるのはよいのですが、本当はそこに「recitation001.wav.npy
」等のファイルも出るのですが、それはないですか?
また、preprocess_all
の結果の出力を教えていただくことはできるでしょうか?
今気づきましたが、見せていただいた画像では音声ファイルはrecitation_1.wav
ですが書き起こしではrecitation001.wav
となっていて、そこの不一致でファイルが出てきていない可能性もありますので、書き起こしかファイル名を修正して試していただけないでしょうか。
ファイル名を修正してみたら学習始まりました。 ありがとうございます!
解決済みの質問に似たようなエラーの対処法があり試してみたんですが、上手くいきません。 一度、rawとesd.listのみにしてからトレーニングを始めても治りません。
使っているesd.listの形式はこのようになっています。