Plachtaa / VITS-fast-fine-tuning

This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion
Apache License 2.0
4.69k stars 703 forks source link

Colab微调完成后,VC_Inference的时候报错了,Audio的api也变了。 #521

Open SetoKaiba opened 9 months ago

SetoKaiba commented 9 months ago

Colab微调完成后,VC_Inference的时候报错了,报Pydantic的问题。

ImportError: cannot import name 'RootModel' from 'pydantic' (/usr/local/lib/python3.10/dist-packages/pydantic/__init__.cpython-310-x86_64-linux-gnu.so)
SetoKaiba commented 9 months ago

image 奇怪,好像和这句有关呀,我记得我之前运行都还是好的呀。我把pydantic升级到2以上不会报这个错误。

SetoKaiba commented 9 months ago

应该是Gradio更新了的原因,改了pydantic的版本,Audio也会报错,新版的gradio的Audio,参数source变成sources了。

GH3a commented 9 months ago

遇到同样的问题

Lu233 commented 9 months ago

应该是Gradio更新了的原因,改了pydantic的版本,Audio也会报错,新版的gradio的Audio,参数source变成sources了。

请问这个问题正式解决方案是什么,谢谢

Lu233 commented 9 months ago

应该是Gradio更新了的原因,改了pydantic的版本,Audio也会报错,新版的gradio的Audio,参数source变成sources了。

请问这个问题正式解决方案是什么,谢谢

我把Gradio卸载了,重新安装了Gradio版本3.45.2,问题解决了,感谢提示

SetoKaiba commented 9 months ago

应该是Gradio更新了的原因,改了pydantic的版本,Audio也会报错,新版的gradio的Audio,参数source变成sources了。

请问这个问题正式解决方案是什么,谢谢

正式的解决方案应该是 https://github.com/Plachtaa/VITS-fast-fine-tuning/blob/main/VC_inference.py#L134-L135 改成

                record_audio = gr.Audio(label="record your voice", sources=["microphone"])
                upload_audio = gr.Audio(label="or upload audio here", sources=["upload"])

并且把Colab的Step1里的这句删除

!python -m pip install pydantic==1.10.4

@Plachtaa Colab不在库里,也无法提交PR。就算我提交VC_inference.py的PR也不完整。不如作者你修正一下?

codewen77 commented 9 months ago

VC_inference.py 第134 135行改成: record_audio = gr.Audio(label="record your voice", sources=["microphone"]) upload_audio = gr.Audio(label="or upload audio here", sources=["upload"]) 同时,更新pydantic版本 pip install --upgrade pydantic

ccjackcong commented 8 months ago

谢谢分享经验,弄了一周,终于在这里找到答案了。这个方法是可行的,第一次把代码跑起来。我有个疑问,这个本地训练,能在mac上进行么?

codewen77 commented 8 months ago

谢谢分享经验,弄了一周,终于在这里找到答案了。这个方法是可行的,第一次把代码跑起来。我有个疑问,这个本地训练,能在mac上进行么?

mac没试过,我试过本地linux服务器跑,可以跑,但是问题会比较多,本地部署比colab的问题多很多

ccjackcong commented 8 months ago

谢谢分享经验,弄了一周,终于在这里找到答案了。这个方法是可行的,第一次把代码跑起来。我有个疑问,这个本地训练,能在mac上进行么?

mac没试过,我试过本地linux服务器跑,可以跑,但是问题会比较多,本地部署比colab的问题多很多

感谢您指教。那我就在colab上训练,然后用win电脑推理吧。。。另外,我想请教,tits和tactron2或者其他的,哪个适合用自己的声音训练后,做文字转语音的节目那?谢谢

codewen77 commented 8 months ago

Tacotron2没咋用过 vits的话合成语音速度较快,整体生成质量还不错,t2貌似差不多。 你也可以试一下vall-e-x ,这个生成的质量挺不错,而且更富有情感

---- 回复的原邮件 ---- | 发件人 | @.> | | 发送日期 | 2023年12月05日 19:40 | | 收件人 | Plachtaa/VITS-fast-fine-tuning @.> | | 抄送人 | codewen77 @.>, Comment @.> | | 主题 | Re: [Plachtaa/VITS-fast-fine-tuning] Colab微调完成后,VC_Inference的时候报错了,Audio的api也变了。 (Issue #521) |

谢谢分享经验,弄了一周,终于在这里找到答案了。这个方法是可行的,第一次把代码跑起来。我有个疑问,这个本地训练,能在mac上进行么?

mac没试过,我试过本地linux服务器跑,可以跑,但是问题会比较多,本地部署比colab的问题多很多

感谢您指教。那我就在colab上训练,然后用win电脑推理吧。。。另外,我想请教,tits和tactron2或者其他的,哪个适合用自己的声音训练后,做文字转语音的节目那?谢谢

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

ccjackcong commented 8 months ago

Tacotron2没咋用过 vits的话合成语音速度较快,整体生成质量还不错,t2貌似差不多。 你也可以试一下vall-e-x ,这个生成的质量挺不错,而且更富有情感 ---- 回复的原邮件 ---- | 发件人 | @.> | | 发送日期 | 2023年12月05日 19:40 | | 收件人 | Plachtaa/VITS-fast-fine-tuning @.> | | 抄送人 | codewen77 @.>, Comment @.> | | 主题 | Re: [Plachtaa/VITS-fast-fine-tuning] Colab微调完成后,VC_Inference的时候报错了,Audio的api也变了。 (Issue #521) | 谢谢分享经验,弄了一周,终于在这里找到答案了。这个方法是可行的,第一次把代码跑起来。我有个疑问,这个本地训练,能在mac上进行么? mac没试过,我试过本地linux服务器跑,可以跑,但是问题会比较多,本地部署比colab的问题多很多 感谢您指教。那我就在colab上训练,然后用win电脑推理吧。。。另外,我想请教,tits和tactron2或者其他的,哪个适合用自己的声音训练后,做文字转语音的节目那?谢谢 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

好的,非常感谢。vall-e-x我试了,因为我不是学编程的,所以报错排查的比较吃力。vall-e-x程序我还没跑成功,在最后也是报错,也看了很多人的回复,但是暂时还都没解决。