Closed Lion-Wu closed 9 months ago
可以pr个,你pr完我测试下win和linux的兼容性
可以pr个,你pr完我测试下win和linux的兼容性
好,我试一下
超級感謝!M2已經安裝完成,要來運行看看了
btw, 第9項的「运行webUI即可:python wbeui.py」應更正為「运行webUI即可:python webui.py」就完美了
btw, 第9項的「运行webUI即可:python wbeui.py」應更正為「运行webUI即可:python webui.py」就完美了
感谢指正!我这愚蠢的错误🤥
请问下使用你云盘的包,可以升级最新版本吗?如何升级?
请问下使用你云盘的包,可以升级最新版本吗?如何升级?
什么意思?
Git pull
这个可能不行,我不太清楚。我尽快给作者pr,等合并之后再重新下载原项目更新吧
有其他mac运行成功的案例吗,想知道是不是macos系统的原因(我是macos·12)导致生成的模型推理出来没声音。
有其他mac运行成功的案例吗,想知道是不是macos系统的原因(我是macos·12)导致生成的模型推理出来没声音。
我是M2 Max,系统是macOS 14.2.1,按 @Lion-Wu 提供的包和安装方法走了一遍,推理出的模型有声音,但是只是哼哼哈哈的声音...
有其他mac运行成功的案例吗,想知道是不是macos系统的原因(我是macos·12)导致生成的模型推理出来没声音。
有可能是训练本身的问题,我能输出但是效果有差距,感觉训练时间的问题
下载部署以后在最后的推理出现了问题,推理开始挺快,到15以后逐渐变慢,然后报错,请问这个应该如何解决
有其他mac运行成功的案例吗,想知道是不是macos系统的原因(我是macos·12)导致生成的模型推理出来没声音。
有可能是训练本身的问题,我能输出但是效果有差距,感觉训练时间的问题
我尝试修改了可能导致问题的代码,正在给作者pr,可以等晚点合并了再试试看有没有这个问题
我用intel的Mac,请问可以完全用cpu跑吗?慢一点没关系
下载部署以后在最后的推理出现了问题,推理开始挺快,到15以后逐渐变慢,然后报错,请问这个应该如何解决
查看一下是否内存占用过高,出现了使用了swap内存交换导致的性能下降
我用intel的Mac,请问可以完全用cpu跑吗?慢一点没关系
这个我不确定,可以尝试一下,当然可能需要更改一些代码。
大概要改哪些地方的啊?😂
大概要改哪些地方的啊?😂
主要就是把所有device = "mps"改成device = "cpu",把.to("mps")换成.to("cpu"),还有一个地方我记得会提示只能用GPU训练,你可以把那一行删掉后试一下
大概要改哪些地方的啊?😂
如果只是用来推理只需要改inference.py
你可以参考https://github.com/RVC-Boss/GPT-SoVITS/issues/93#issue-2091450808
这个是用CPU推理的,intel应该可以
根据 #93 改了一下,但仍然一直报错 FileNotFoundError: [Errno 2] No such file or directory: 'logs/ss/2-name2text-0.txt'
根据 #93 改了一下,但仍然一直报错 FileNotFoundError: [Errno 2] No such file or directory: 'logs/ss/2-name2text-0.txt'
这个只能用于推理,应该没法训练,你可以尝试云端训练,再本地推理
ok我试试
有人对比过CPU与GPU的推理速度吗?GPU运行有更快吗?
Traceback (most recent call last):
File "/Users/xxx/workspace/GPT-SoVITS/tools/damo_asr/cmd-asr.py", line 23, in
有其他mac运行成功的案例吗,想知道是不是macos系统的原因(我是macos·12)导致生成的模型推理出来没声音。
我是M2 Max,系统是macOS 14.2.1,按 @Lion-Wu 提供的包和安装方法走了一遍,推理出的模型有声音,但是只是哼哼哈哈的声音...
我又测试了一下不同的生成模型,结果发现GPT_weights
的模型数值越高的越逼真(e15.pth
比e5.pth
的语气更连贯);但SoVITS_weights
只能选e4_s32.pth
,选e8就开始有口齿不清的状况,选e12就会出现只有哼哼哈哈的状况了。SoVITS_weights
这是越训练效果越差吗...
有人对比过CPU与GPU的推理速度吗?GPU运行有更快吗?
区别不大
Traceback (most recent call last): File "/Users/xxx/workspace/GPT-SoVITS/tools/damo_asr/cmd-asr.py", line 23, in inference_pipeline = pipeline( File "/Users/xxx/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/modelscope/pipelines/builder.py", line 170, in pipeline return build_pipeline(cfg, task_name=task) File "/Users/xxx/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/modelscope/pipelines/builder.py", line 65, in build_pipeline return build_from_cfg( File "/Users/xxxx/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/modelscope/utils/registry.py", line 215, in build_from_cfg raise type(e)(f'{obj_cls.name}: {e}') ImportError: AutomaticSpeechRecognitionPipeline: dlopen(/Users/xxxx/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/hdbscan/_hdbscan_linkage.cpython-39-darwin.so, 0x0002): tried: '/Users/xxxx/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/hdbscan/_hdbscan_linkage.cpython-39-darwin.so' (mach-o file, but is an incompatible architecture (have 'x86_64', need 'arm64')), '/System/Volumes/Preboot/Cryptexes/OS/Users/xxx/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/hdbscan/_hdbscan_linkage.cpython-39-darwin.so' (no such file), '/Users/xxx/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/hdbscan/_hdbscan_linkage.cpython-39-darwin.so' (mach-o file, but is an incompatible architecture (have 'x86_64', need 'arm64'))
Intel chip用CPU推理吧
各位久等了,我优化了一下代码,并提交了PR,原项目已支持mps,不过代码还是有些问题,请等待这个PR合并后克隆仓库最新代码并按照README进行安装。
关于推理效果、吞字情况可参考 #51、#70 中的描述,也许不是mps的问题。也希望更多人可以反馈运行的效果,谢谢各位。
内存泄漏问题仍然存在,如果出现问题的可以修改代码切换到CPU推理(我还没试过,CPU推理应该没有内存泄漏吧)
另外仓库中的代码应该已经支持自动对不支持GPU推理的设备使用CPU推理,不过没有对CPU训练进行优化,是否可行还没有测试。
附MPS支持条件:带有Apple 芯片或AMD GPU的Mac,macOS 12.3或更高版本,Python 3.7或更高版本,已安装Xcode command-line tools: xcode-select --install
另外碰到其他问题还请提出,谢谢各位了
在推理的过程中尝试了SoVITS里的240和480,在推理完以后不管输入多少字符,结果输出都显示1分钟,这很奇怪,并且240输出的声音都是呃呃呃呃呃呃呃呃的声音,480输出的声音都是呜呜呜呜呜呜呜的声音。。。。。并没有按照字符输出,看其他的问题里也有提过修改is_half = True改成False,结果也是一样,这是什么情况,大家有遇到过吗
在推理的过程中尝试了SoVITS里的240和480,在推理完以后不管输入多少字符,结果输出都显示1分钟,这很奇怪,并且240输出的声音都是呃呃呃呃呃呃呃呃的声音,480输出的声音都是呜呜呜呜呜呜呜的声音。。。。。并没有按照字符输出,看其他的问题里也有提过修改is_half = True改成False,结果也是一样,这是什么情况,大家有遇到过吗
尝试仓库最新版本代码重新试一下看看
尝试了仓库里新版本的代码,新的代码貌似在微调的时候不只是gpu在运算,cpu也在被占用
推理出来后还是都是呃呃呃呃呃呃呃呃呃的声音,而且还是出现输出的声音还都是一分钟,请问大家推理出来的声音正常吗
尝试了仓库里新版本的代码,新的代码貌似在微调的时候不只是gpu在运算,cpu也在被占用 推理出来后还是都是呃呃呃呃呃呃呃呃呃的声音,而且还是出现输出的声音还都是一分钟,请问大家推理出来的声音正常吗
重新训练或者尝试其它模型试试?另外CPU应该是进行NumPy运算,无法使用GPU的
尝试了很多次重新训练,但是依然出现都是呃呃呃呃呃呃呃呃呃的声音,最后直接换成gpt底模,直接放入音频和参考文本直接输出,竟然可以正常输出了,但是会有严重的吞字问题,音色没有问题,但是有一个问题就是提示符下显示推理处理跑不完,有吞字的情况
请问这种推理不完的情况是什么原因,虽然推理不完,但是输出的结果已经不是一分钟那种呃呃呃呃呃的声音了
感谢大家的奉献,这好像是第一个支持mac训练的tts了吧。
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢
你需要安装一个库,执行pip install modelscope==1.10.0
尝试了很多次重新训练,但是依然出现都是呃呃呃呃呃呃呃呃呃的声音,最后直接换成gpt底模,直接放入音频和参考文本直接输出,竟然可以正常输出了,但是会有严重的吞字问题,音色没有问题,但是有一个问题就是提示符下显示推理处理跑不完,有吞字的情况 请问这种推理不完的情况是什么原因,虽然推理不完,但是输出的结果已经不是一分钟那种呃呃呃呃呃的声音了
程序本身就是推理不完的,正常现象,见#219
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢
确保定位到项目目录后执行
pip install -r requirements.txt
pip uninstall torch torchaudio
pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu
理论上这样会安装正确版本的依赖的,你看看安装的时候有没有报错
博主好,我是个产品,技术小白。
按照你的教程,装好了环境和依赖的库,可以正常运行python webui。
但是第一步语音切分的时候,总是失败,看终端代码提示:运行的时候却少“ffmepg”,这个程序我用conda无法直接pip,去官网下载的zip文件,解压直接运行,显示成功。
然后在使用第一步的语音切分,又提示缺少“libmamba”。。。
一直被这两个问题困扰,导致无法正常使用,请问有什么方案能解决么?
我是mac系统~~
博主好,我是个产品,技术小白。
按照你的教程,装好了环境和依赖的库,可以正常运行python webui。
但是第一步语音切分的时候,总是失败,看终端代码提示:运行的时候却少“ffmepg”,这个程序我用conda无法直接pip,去官网下载的zip文件,解压直接运行,显示成功。
然后在使用第一步的语音切分,又提示缺少“libmamba”。。。
一直被这两个问题困扰,导致无法正常使用,请问有什么方案能解决么?
我是mac系统~~
可以看readme中的ffmpeg安装方法,Mac运行brew install ffmpeg
第二个问题可以提供一下具体的报错内容吗
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢
你需要安装一个库,执行pip install modelscope==1.10.0
感谢您的回复,我之前莫名安装的是1.11.0,降级后好了。谢谢指导。
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢
确保定位到项目目录后执行
pip install -r requirements.txt pip uninstall torch torchaudio pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu
理论上这样会安装正确版本的依赖的,你看看安装的时候有没有报错
感谢您回复,刚按照HuaQitian519的指导,降级了一下modelscope版本就正常了。但是我现在的界面是英文的,按钮菜单跟大家的也有点不一样,不知道是不是ui搞错了还是怎么?我下的是您发布在icloud上的那个版本直接用的。
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢
确保定位到项目目录后执行
pip install -r requirements.txt pip uninstall torch torchaudio pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu
理论上这样会安装正确版本的依赖的,你看看安装的时候有没有报错
感谢您回复,刚按照HuaQitian519的指导,降级了一下modelscope版本就正常了。但是我现在的界面是英文的,按钮菜单跟大家的也有点不一样,不知道是不是ui搞错了还是怎么?我下的是您发布在icloud上的那个版本直接用的。
还是建议你克隆仓库的代码进行安装,然后可以把iCloud中的那些模型文件拖进去,这样用的是最新版本
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢
确保定位到项目目录后执行
pip install -r requirements.txt pip uninstall torch torchaudio pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu
理论上这样会安装正确版本的依赖的,你看看安装的时候有没有报错
感谢您回复,刚按照HuaQitian519的指导,降级了一下modelscope版本就正常了。但是我现在的界面是英文的,按钮菜单跟大家的也有点不一样,不知道是不是ui搞错了还是怎么?我下的是您发布在icloud上的那个版本直接用的。
还是建议你克隆仓库的代码进行安装,然后可以把iCloud中的那些模型文件拖进去,这样用的是最新版本
好的,感谢。
请问下模型文件有几个呀?在哪个文件夹? 2024年1月28日 +0800 11:20 Lion-Wu @.***>,写道:
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢 确保定位到项目目录后执行 pip install -r requirements.txt pip uninstall torch torchaudio pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu 理论上这样会安装正确版本的依赖的,你看看安装的时候有没有报错 感谢您回复,刚按照HuaQitian519的指导,降级了一下modelscope版本就正常了。但是我现在的界面是英文的,按钮菜单跟大家的也有点不一样,不知道是不是ui搞错了还是怎么?我下的是您发布在icloud上的那个版本直接用的。 还是建议你克隆仓库的代码进行安装,然后可以把iCloud中的那些模型文件拖进去,这样用的是最新版本 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
请问下模型文件有几个呀?在哪个文件夹? 2024年1月28日 +0800 11:20 Lion-Wu @.***>,写道: …
刚测试了一下,在声音转文字打标的时候报错,没有生成文件。哪位大佬给看看什么问题?谢谢 > > 确保定位到项目目录后执行 > > pip install -r requirements.txt > > pip uninstall torch torchaudio > > pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu > > 理论上这样会安装正确版本的依赖的,你看看安装的时候有没有报错 > 感谢您回复,刚按照HuaQitian519的指导,降级了一下modelscope版本就正常了。但是我现在的界面是英文的,按钮菜单跟大家的也有点不一样,不知道是不是ui搞错了还是怎么?我下的是您发布在icloud上的那个版本直接用的。 还是建议你克隆仓库的代码进行安装,然后可以把iCloud中的那些模型文件拖进去,这样用的是最新版本 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
很好辨别,就是那些好几百MB或者好几GB的文件就是模型文件,然后把它替换掉就行了,有这些:GPT_SoVITS/pretrained_models
、tools/damo_asr/models
、tools/uvr5/uvr5_weights.
我在想。。。这是卡在哪一步了?部署两次都是这里不动了 噫呜呜噫。。。 请问应该怎么办呢?用的项目首页的部署办法,现在是安装依赖。
我在想。。。这是卡在哪一步了?部署两次都是这里不动了 噫呜呜噫。。。 请问应该怎么办呢?用的项目首页的部署办法,现在是安装依赖。
看看是不是网络问题,或者等久一点看看
本项目已支持Mac训练,请不要根据本教程安装,按照README克隆原项目代码进行安装。
我修改了一些代码,让它可以在Mac上运行,支持MPS加速,给各位写个具体的方法:
cd 你的项目路径
pip install -r requirements.txt
pip install funasr==0.8.7
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu
brew install ffmpeg
python webui.py
基本上大部分webUI内的功能都可使用MPS运行,不过有几个例外:
已知问题:存在内存泄漏,主要体现在推理时,多次推理后可能导致内存占用很高,暂时不知道如何解决。不过大体上不太影响,重启推理UI可以释放内存。
修改过程主要就是对所有分布式训练的代码进行更改,因为mps上不需要也不支持分布式训练。
代码改动较复杂,之后如果可能,我会尝试给作者提交PR。 这是我目前为止用过的效果最好的TTS项目,非常感谢作者开源! 如果有任何问题或建议欢迎提出