-
长文本的音色是乱的,不固定
-
如题
-
请问推理代码中'[speed_5],[oral_2],[laugh_0],[break_6]这些参数都是用来干什么的啊,有什么意义么,源代码如下
params_infer_code = {'prompt':'[speed_5]', 'temperature':.3}
params_refine_text = {'prompt':'[oral_2][laugh_0][break_6]'}
-
Would you upload the model to Modelscope
-
on a mac i get error when installing requirement
nemo_text_processing
mac air M2
python 3.11
arm
clang -Wsign-compare -Wunreachable-code -fno-common -dynamic -DNDEBUG -g -fwrapv -O3 -…
-
README文件更新一下!!!
代码更新一下!!!
issues里面的问题有的说改了但是我pull最新的代码发现并没有同步,就比如torchaudio库换soundfile,infer_file中[]的问题,do_text_normalization=False说明一下
还有就是评论有的人让下载conda,之前你不用这个管理python环境的完全不需要!!!
中文没问题,正常读了!!!!
…
-
运行 conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
报以下错误
Channels:
- conda-forge
- defaults
Platform: osx-arm64
Collecting package metadata (repodata.json): done
Sol…
-
Collecting deepspeed==0.12.4 (from resemble-enhance)
Using cached deepspeed-0.12.4.tar.gz (1.2 MB)
Preparing metadata (setup.py) ... error
error: subprocess-exited-with-error
× python se…
-
新版使用了 nemo_text_processing 和 pynini 来处理中文,但遗憾的是,pynini压根无法在windows平台安装和使用,要使用,也只能安装在WSL子系统上。
不管给出的什么安装方式, 比如
```
pip install pynini==2.1.5 Cython WeTextProcessing
```
都是无法在Windows上正确…
-
chattts确实是目前开源tts的天花板。
但用于实际应用,应该还要解决下面几个问题:
1. 训练自己的语音(克隆)
2. 加速推理(目前推理速度太慢,很难做到机器人实时对话)
3. 推理结果流式输出(做到机器人实时对话必须要流式输出)
咨询过作者,关于推理加速,以及流式输出,作者希望由社区来自主开发完成。不知道有没有有兴趣的朋友已经在动手做了?