litagin02 / Style-Bert-VITS2

Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles.
GNU Affero General Public License v3.0
774 stars 100 forks source link

【学習前処理】カタカナの読み仮名があったらそれを音素に変換してつかう #148

Open seichi042I opened 5 months ago

seichi042I commented 5 months ago

pyopenjtalkの誤読問題の回避策として、あらかじめカタカナで読み仮名を書き起こしておき、それをもとに音素に変換して学習に使う。 esd.listの末尾にカタカナ読み仮名のオプショナル項目を想定して、preprocess_text.pyの処理を変更する。