Hiroshiba / become-yukarin

Convert your voice to favorite voice
https://hiroshiba.github.io/blog/became-yuduki-yukari-with-deep-learning-power/
MIT License
576 stars 88 forks source link

パラメータの意味について #53

Closed BURI55 closed 5 years ago

BURI55 commented 5 years ago

第一段階第二段階のの学習でモデルのログファイルに出力されるiterationの意味(5000ごとにファイルを吐き出すようになっているようだ。)と、第二段階の学習がGPUメモリが少なくて動かない時にdatフォルダのconfig_sr.jsonで下げて設定するbatchsizeやtrain_crop_sizeやgenerator_base_channelsの意味を教えてください。ちなみにGTX10603GBではヒホさんの設定では動かなくて、batchsizeを2から1、train_crop_sizeを512から256、generator_base_channesを64から32にして第二段階の学習を回しています。これによって精度が落ちることは考えられるでしょうか?またGPUメモリがたくさんあるGPUで、この数値を上げると精度が増すということは考えられるでしょうか?

Hiroshiba commented 5 years ago

iterationやbatchsizeは機械学習の基礎なため、説明を省きます。

train_crop_sizeは過去のissueを見てください。 generator_base_channelsはCNNのチャンネル数と比例していて、大きいほどチャンネル数が増えます。

精度については試していないのでわかりません。 直感的には、それらの値でもそこまで大きく精度が下がることは無いと思います。

もし追加でわかったことがあったら、ぜひ共有してください。

BURI55 commented 5 years ago

train_crop_sizeの意味 #35