litagin02 / Style-Bert-VITS2

Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles.
GNU Affero General Public License v3.0
717 stars 86 forks source link

「うっうが」等の何らかの条件を満たす文字列のg2pに失敗する #70

Open litagin02 opened 7 months ago

litagin02 commented 7 months ago

「うっうが」→アクセント取得ではう っ っ がになぜか変換され、pyopenjtalk.run_frontend()の結果では発音がうっーがになり、その不一致からalign_tonesの処理に失敗する。

おそらくopenjtalkのバグによりそうだが、どう対処するのが正解か分からない。

OzoneAsai commented 7 months ago

"、"とかのshort_pauseを挿入してみたり... でも条件が判明していないんじゃぁ...

WariHima commented 7 months ago

多分順番的には読み→音素

いくつか試してみた感じ 特定の条件を満たすと“う”が“ー”になるバグと(今のところ”うっう“のみで確認)、 “っー“を音素に直すときに”ー“が何故か”っ“になるバグのようです。

WariHima commented 7 months ago

njdのコードを見た感じ動詞か助動詞として登録されている語の後に助動詞の読み方がウの語があるとウが長音化する処理があります。 たとえば おおっう とかでも起ります。