AlexandaJerry / whisper-vits-japanese

Vits Japanese with Whisper as data processor (you can train your VITS even you only have audios)
MIT License
163 stars 28 forks source link

补充一点多人训练clean时的参数调整以及numpy版本问题 #8

Open Raincarnator opened 1 year ago

Raincarnator commented 1 year ago

若你使用了auto_ms.py来生成txt,则必须在Alignment and Text Conversion这一步应修改为

!python preprocess.py --text_index 2 --text_cleaners japanese_cleaners --filelists /content/whisper-vits-japanese/filelists/train_filelist.txt /content/whisper-vits-japanese/filelists/val_filelist.txt

由于多人训练的txt格式与单人训练不同,这里必须要将 text_index 参数修改为对应格式的下标,即 2。否则会clean错文本,变成将speakId给clean成数字的发音了。

另外,不清楚是我的环境的问题,在使用默认的numpy版本时在 train_ms.py 这一步时会报错:

ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 96 from C header, got 88 from PyObject

我是通过更新numpy版本来解决的:

!pip install numpy==1.23.1

目前尚不清楚这个问题能不能复现以及具体报错位置,但总之 1.23.1 这个版本能正常运行。

AlexandaJerry commented 1 year ago

感谢你的回复!我将进行修改

Raincarnator commented 1 year ago

刚刚重新跑一遍又发现之前忘了说的一个问题 在多人训练的 train_ms.py 的第52行中将 MASTER_PORT 指定为了80000(然而在 train.py 中是正常的8008),然后报了以下错误:

ValueError: port must have value from 0 to 65535 but was 80000.

显然是很基础的错误,或许是多打了个0?

AlexandaJerry commented 1 year ago

感谢你的回复!我来进行修改!