keonlee9420 / Expressive-FastSpeech2

PyTorch Implementation of Non-autoregressive Expressive (emotional, conversational) TTS based on FastSpeech2, supporting English, Korean, and your own languages.
Other
267 stars 46 forks source link

mfa 결과 이슈 #17

Closed Moon-sung-woo closed 2 years ago

Moon-sung-woo commented 2 years ago

안녕하세요. 올려주신 코드 덕분에 많이 참고하여 개발하고 있습니다. 감사합니다. 제가 한국어 데이터를 가지고 duration을 얻기위해 mfa 학습을 진행하였는데 마지막 단어에 대한 duration을 얻지 못하고'spn'으로 추출되 질문 남깁니다.

제가 mfa를 train 하기 위해 수행한 것은 다음과 같습니다.

  1. wav-lab pari 생성 (.wav file과 .lab file이 같은 경로상에 위치)
  2. lexicon file 생성 (g2pk를 이용해 phoneme생성)
  3. mfa 학습 시작 (mfa train <데이터셋 위치> <lexicon file의 위치> )
    • mfa version = 2.0.0rc5

mfa train을 마치고 얻은 TextGrid를 보면 마지막에 대한 문장이 나와있지 않습니다. Q1. 혹시 mfa를 이용하셨을 때 저와 같은 현상을 겪으신적이 있는지 궁금하여 이슈 남깁니다. (다화자에 대한 mfa 훈련을 진행했습니다.)

Q2. 올려주신 /text를 보면 'spn'으로 추출된 것을 무음으로 처리하는 것 같은데, 그럼 제가 얻은 TextGrid를 사용하기 힘든 것일까요?