-
微调步骤参考:https://mp.weixin.qq.com/s/Xo-pMe3-P-fJ-32Z1JLonA
已尝试过:
kantts/configs/sambert_16k_MAS.yaml(发音人已修改)
speech_sambert-hifigan_tts_zh-cn_multisp_pretrain_16k/basemodel_16k/sambert/config.yaml(发音…
wjddd updated
11 months ago
-
there are no single speaker datasets for male, but in multi-speaker tts datasets(aishell3, vctk),there are Male speakers,
You can find speaker_id_map.txt in `~/.paddlespeech/models/fastspeech2_aishel…
-
你在預處理的時候,把TextGrid中空白區域變成sil,但infer的時候使用的處理卻是使用sp作為替代,似乎是使用未訓練的sp作為空白音的phoneme。
我測試的時候,發現似乎sp會因為訓練的問題,導致合成聲音會有滋滋聲。
然後想讓您給個建議,我目前35萬步的 200位語者200hr的聲音,但是語料內的語者在使用infer的時候,相似度似乎還是不高,雖然音質都不錯,有沒有什麼訓練上的建議…
-
### 需求描述 Feature Description
tensor.numpy()执行大量数据从GPU拷贝到CPU速度缓慢,5M数据执行tensor.numpy()耗费了1.4s,完全不可接受!啥原因呢?
### 替代实现 Alternatives
_No response_
-
![image](https://user-images.githubusercontent.com/88066528/233041833-ff20bae0-0967-4416-b6f6-1e9ec8a9371e.png)
生成是成功的,调节语速也一样,就是最后一个字的半个音会被切掉是为什么
-
大佬,我构建了多说话人数据集,修改了train.py和对应的配置文件。训练的模型发音混乱是为啥呀?说话人顺序不定,生成语音质量也差。
-
Hi, when I run my toy script, I find a bug have a question about this:
when `batch` input in Policy class's `forward` function, it is `Batch` type. but it will input to the model, and the model's `o…
-
Share your Chinese synthesis results or mandrain model training questions.
-
## Others
最近在aishell3数据集上训练fastspeech2模型的时候,遇到了几个问题想请教一下。
【说明】声码器是HiFiGAN,batch size为64,MFA使用的是1.x版本,在自己的数据集上训练的mfa模型
+ 问题1:不论是基于frame-level还是phoneme-level,在duration, energy和pitch上:在大约50k…
-
我用一张A100训练AIShell3,2天了才跑75个epoch,如果要达到预训练模型那种程度,必须要跑100K step才行吗,目前我好像66k step只能听到电流声,一点语音都没有
![321](https://github.com/ConsistencyVC/ConsistencyVC-voive-conversion/assets/19279148/b682fd0a-1441-4461…