jaywalnut310 / glow-tts

A Generative Flow for Text-to-Speech via Monotonic Alignment Search
MIT License
651 stars 150 forks source link

With out Training DDI #71

Open johnny9696 opened 1 year ago

johnny9696 commented 1 year ago

멀티 GPU를 사용하지 않고 학습하는 과정에서 에러가 발생합니다. 따라서 DDI 관련된 세팅을 False로 전환하여 학습을 했습니다. 이때 학습이 되지 않습니다. Loss값이 줄어 들는 것을 확인 했지만, 오디오를 들어보면 노이즈만 들려오는 문제가 발생합니다. 또한 Pretrained model을 불러 왔을 때 text embedding에서 length가 맞지 않아 pretrained model을 불러 올 수 없는 에러가 발생합니다. 어떤 문자를 제거하여 train을 진행하면 되는지 언급해주시면 감사합니다.