-
--> Config model
done
--> Loading model
I It is recommended onnx opset 19, but your onnx model opset is 13!
I Model converted from pytorch, 'opset_version' should be set 19 in torch.onnx.export fo…
-
在其他issue中回复,但无法引起注意。因此开一个新的issue。希望有人答疑解惑。
此前已经实验了[develop/examples/other/tts_finetune/tts3](https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/other/tts_finetune/tts3),单个成年女声的迁移能力还…
-
ValueError: (InvalidArgument) Attr(axis) value should be in range [-R, R-1], R is the rank of Input(X). But received axis: 1, R: 1. Current Input(X)'s shape is=[256].
[Hint: Expected axis < x_rank,…
-
Hi ,Thank you for great work.
But I get a bad with my model.
I train the model with `sampling_rate=16k` with AiShell3 data. And my train epoch is 150+ (almost 150000+step, my **batch** is 90). And…
-
你好,使用AISHELL-3数据集按照readme进行训练,loss的图如下,尝试推理但是不能合成出正常声音,请问是为什么呢?
text/symbols.py已经更改为中文的。
![image](https://user-images.githubusercontent.com/20598757/209748616-b7cf3d4e-dc3c-42c6-9dee-dabf4dd8851d.pn…
-
拿aishell3的数据集训练,loss下降的很快,模型run2000轮就能输出较为清晰的语音。用自己收集来的语音去训练,收敛很慢且输出结果不太理想。
自己的数据频谱清晰无杂音,不是很明白为什么效果和aishell差这么多,请指教
-
在aishell3数据中,有些wav文件通过librosa生成振幅向量的时候,振幅大小会超过1
如: SSB08870032.wav 文件的最大振幅为1.0116
导致运行wav2mel.py的时候会中断报错.
具体问题如下:
文件 /mtts/utils/stft.py 第248 、249行
为什么要对wav的振幅向量限制在[-1,1]呢 ?
-
`# -*- coding:utf-8 -*-
import paddle
import yaml
import soundfile as sf
from yacs.config import CfgNode
from paddlespeech.t2s.frontend.mix_frontend import MixFrontend
from paddlespeech.t2s.exps…
-
参考[https://zhuanlan.zhihu.com/p/587765776](url)代码就改了下文件路径,运行报错,python和paddle都装好了。
报错:
`Traceback (most recent call last):
File "E:\Record\anntest\test_1.py", line 26, in
frontend = get_fr…
-
hi ming024
i have some questions about inference。
1)energy and pitch change ,but the generat wav is similiar.
i set pitch 0.7、1.0、5, the wav sounds similiar.
"--pitch_control",
…