win系统+RTX2060能顺利训练模型吗

jerryuhoo / VTuberTalk

Apache License 2.0

366 stars 54 forks source link

Open lijielijie opened 2 years ago

lijielijie commented 2 years ago

使用这个项目，能在win10+RTX2060的环境下训练fastspeech2等模型吗

jerryuhoo commented 2 years ago

没试过不太清楚，但是训练速度肯定会比较慢

lijielijie commented 2 years ago

我执行2.4. 使用ASR获得文本时，提示我 No module named 'paddlespeech'，我直接用pip install paddlespeech命令安装就可以吧？

jerryuhoo commented 2 years ago

是的

lijielijie commented 2 years ago

萌新再问一个入门的问题，单人跟多人具体是啥区别，我是从B站找了一个主播的视频，拿来训练，这是算是单人数据集吗

jerryuhoo commented 2 years ago

数据集过小的话建议多人，比如几百句。数据集足够的话可以单人训练，比如有一万句。你这个算是单人训练。

lijielijie commented 2 years ago

这里好像少了1个参数：--speaker-dict=dump/speaker_id_map.txt

lijielijie commented 2 years ago

然后再问一个训练的问题，这五张图主要看哪个指标的loss，这个loss低到多少才算训练初成

jerryuhoo commented 2 years ago

这里好像少了1个参数：--speaker-dict=dump/speaker_id_map.txt

现在好像是单人和多人都需要speaker-dict，那么应该不需要分开了，我之后改一下。

jerryuhoo commented 2 years ago

然后再问一个训练的问题，这五张图主要看哪个指标的loss，这个loss低到多少才算训练初成

主要看eval/loss/你这个训练好像有点问题，检查一下数据吧