litagin02 / Style-Bert-VITS2

Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles.
GNU Affero General Public License v3.0
778 stars 100 forks source link

細かな修正 (#92 を参照) #95

Closed tsukumijima closed 8 months ago

tsukumijima commented 8 months ago

前回のプルリク (#92) で漏れてしまった、下記の細かな修正を行いました。

[!TIP] Revert されてるコミットがありますが、これは Web UI で学習を開始する際「app.py 起動時に BERT モデルが事前ロードされると VRAM が圧迫されるし明示的に音声合成された時にのみ事前ロードするようにしないといけないのでは…?」と思っていたものの、実際にはロードだけでは通常のメモリしか消費せず VRAM の節約にならない事が分かったためです…。

litagin02 commented 8 months ago

ありがとうございます! 問題なさそうなのでマージします。

litagin02 commented 8 months ago

Revertされていた https://github.com/litagin02/Style-Bert-VITS2/commit/9e5222619fd6d00ca9837c2325b728df0ead0b7c ですが、VRAMの問題というよりも、学習やデータセットづくりのために立ち上げたときのも不要なBERTモデルロードの処理が走り単純に時間がかかってストレスだなあと思っていたので、取り入れることにします。