[문제해결요청] python synthesizer.py --load_path logdir-tacotron2/moon_2020-04-09_17-42-32 --num_speakers 2 --speaker_id 0 --text "당신을 사랑해요"

hccho2 / Tacotron2-Wavenet-Korean-TTS

Korean TTS, Tacotron2, Wavenet

MIT License

161 stars 93 forks source link

Open paman2 opened 4 years ago

paman2 commented 4 years ago

python synthesizer.py --load_path logdir-tacotron2/moon_2020-04-09_17-42-32 --num_speakers 2 --speaker_id 0 --text "당신을 사랑해요"

수행후 생성된 .wav 파일내용은 "먼저~" 이렇게 하고 끝나버립니다

logdir-tacotron2/moon_2020-04-09_17-42-32/model.ckpt-44000.* 까지 추출되었습니다

제 최종 목표는 제 목소리를 이 모델로 해보는 것입니다 꼭 해보고 싶습니다 도움주시면 감사합니다

noakafka commented 4 years ago

저도 비슷한 문제가 발생했습니다. 학습을 충분히 해줬는데도 제가 입력한 text가 아닌 마지막에 학습한 data의 text를 말하는 현상이 계속해서 발생하네요.

paman2 commented 4 years ago

마지막 학습한 데이터인가요? 그러면 마지막 학습데이터를 한번 지워보겠습니다

paman2 commented 4 years ago

마지막 학습한 데이터인가요? 그러면 마지막 학습데이터를 한번 지워보겠습니다

noakafka commented 4 years ago

네. 저도 해보겠습니다. 진행과정 중에 특이사항 있으면 알려드릴게요.

wql7654 commented 4 years ago

학습데이터가 부족해서 그런거같습니다 학습데이터를 1000개이상은 넣으셔야할겁니다..

jenginsu commented 3 years ago

조금 오랜된 질문인듯 한데요. 저도 동일한 현상인데(18만번 이상 step을 진행)

엉뚱한 음성이 만들어 지는데, 제가 넣은 텍스트 음성으로 어떻게 하면 생성되는지 알려주심 안될까요? (처음하는거라 지운다는 말이 뭔 뜻인지 이해도 안되는 그러한 상태입니다. 뭘 지운다는 뜻인지??)

자문자답::: 우선 git에서 제공하는 샘플데이터는 정말 샘플이고, 그걸로 학습 하려다 보니 위의 질문을 하게 된것 같네요. KSS 데이터를 이용하여 학습하니 어느정도 POC 수준에서 검토가 완료 된것 같습니다. 이런 자리를 만들어 주신 주인장께 감사 드립니다~