-
用的examples/ipynb/colab.ipynb的代码,zero shot这段如下
```py
from ChatTTS.tools.audio import load_audio
spk_smp = chat.sample_audio_speaker(load_audio("30s.wav", 24000))
print(spk_smp) # save it in orde…
-
CSV文件能转成PT吗???
-
源码部署 python app.py,测试直接报服务器错误,
![image](https://github.com/user-attachments/assets/60cf4160-fb85-46b3-a633-4afb0d6ff47c)
运行cover.py 或者cover.exe 报错,
![image](https://github.com/user-attachments/as…
-
最新的代码中使用torchaudio.save(audioFile, torch.from_numpy(wavs[0]), 24000)时,在实体机上运行正常,但是在docker中运行的时候就会报错:
File "/data/ChatTTS/examples/web/infura.py", line 82, in customAudio
torchaudio.save(audioFil…
-
v1.0版本后,模型目录转移到了软件根目录下的`asset`文件夹内,不再是 `models`文件夹。
默认将自动下载模型文件到`asset`内,如果因网络问题无法下载,请点击此处链接 https://github.com/jianchang512/ChatTTS-ui/releases/download/v1.0/all-models.7z 手动下载压缩包,下载解压后会得到一个`asse…
-
您好,我使用的版本是ChatTTS WebUI & API(v0.88),添加[laugh],有些音色值是会直接读出来的,有一些却是正常的。
在Prompt选项添加[laugh]会导致乱说,本来是6秒的语音,说出了16秒的词语。
-
for code like these:
```py
class ConvNeXtBlock(nn.Module):
def __init__(
self,
dim: int,
intermediate_dim: int,
kernel: int,
dilation: int,
…
-
1、text为12个中文汉字,推理后生成的音频中间随机的地方会出现“什么”,“就”之类的说话不通顺的过渡词
2、句尾截断,最后会丢一个字,或者是丢最后一个字的大半个音(只读前小半的音),text同样为12个中文汉字
3、compile设为True时,推理过慢,3秒钟的音频需要花5分钟以上的时间
可以请作者看看这些问题吗,用的显卡是A100
代码:
```py
import to…
Ziyi6 updated
1 month ago
-
使用了固定的音色,也固定了seed,但多次合成音色很不问题。
一句话按标点分割后,分段流式合成,合成完之后听起来音色不够稳定。
```
random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)
spk = torch.load('****.pt', map_location=select_device(…
-
1.0源码部署还是有问题,麻烦看下,咋解决,比较急
![微信图片_20240811132958](https://github.com/user-attachments/assets/49f6b8bd-333e-49d3-b4a1-ba801e125e3b)
![微信图片_20240811132947](https://github.com/user-attachments/assets/fc…