kookmin-sw / capstone-2024-08

아나운서 준비생을 위한 맞춤형 AI 스피치 연습 애플리케이션, Loro(로로)
https://kookmin-sw.github.io/capstone-2024-08
5 stars 4 forks source link

[CD-192] SFEN 적용 #81

Closed YunHaaaa closed 3 months ago

YunHaaaa commented 3 months ago

Feature Description

https://velog.io/@yun_haaaa/Capstone-10-Encoding-Speaker-Specific-Latent-Speech-Feature-for-Speech-Synthesis Mel spectogram을 VAE에 넣는 방식으로 변경 Encoder를 Convolution layer를 사용해 VAE를 학습되도록 변경 Decoder를 Hifi GAN을 사용


Tasks to Complete

image

Additional Resources (Optional)