적절한 소스코드를 찾는게 쉽지 않았다. 괜찮은 것 같으면 버전이 안 맞거나 pytorch를 사용했거나 했다. 여차저차해서 찾긴 했는데 과제하면서 코드 뜯어보다보니 repo 이름은 분명 Tacotron 2인데 어째 내용은 Tacotron 1 같다.
이미지 데이터에 이어 오늘은 오디오 데이터를 봤는데, 와... table 형태 데이터는 아무리 더러워도 보고 전처리라도 할 수 있었지, 이렇게 안 다뤄본 타입의 데이터는 뭘 손대야 할 지 감도 안잡힌다. 소스코드 보다보니까 차라리 모델은 논문 보고 keras 써서 구현해내라하면 여차저차 만들 수 있겠는데, 전처리는 정말 모르겠다.
더 알고 싶은 부분 / 공부하고 싶은 부분
TTS나 text generator의 다양한 모델들
느낀 점
어제 CNN 질문하고 나서 정민님이 논문 읽어보면 자세하게 나와있다고 하셔서 아직 그것까진.. 했는데 이렇게 바로 보게 될 줄이야.
키워드
배운 것
어려웠던 부분
더 알고 싶은 부분 / 공부하고 싶은 부분
느낀 점