wlsdml1114 / diff-svc

Singing Voice Conversion via diffusion model
GNU Affero General Public License v3.0
56 stars 19 forks source link

5번 단계에서의 폴더만드는 경로를 어디다 만들어야 하는지 알려주실수 있으십니까? 아래 내용이 이해가 가지 않습니다 #62

Open sseaon opened 1 year ago

sseaon commented 1 year ago

학습 configure를 설정 training폴더에 config.yaml파일(혹은 config_nsf.yaml)을 메모장으로 열어준다. 바꿔야하는 항목들을 보기좋게 위에다가 올려놨다. 아래 내용에서 'test'가 들어간 부분을 님들 맘에 맞게 수정해주면 된다. 그리고 저장 (개발자거나 좀 더 좋은 퀄리티를 위해 커스텀할 사람은 아래 변수들을 추가로 바꿔주면 된다)

original wav dataset folder

3번에서 자르고 변환한 결과 wav파일들을 학습데이터로 만들기위해 넣어줄 폴더 이름

raw_data_dir: data/raw/test

after binarized dataset folder

위 폴더에 있는 학습데이터들을 실제 학습에 사용하기위해 binarize한 결과물을 저장할 폴더

binary_data_dir: data/binary/test

speaker name

이건 나중에 결과물 뽑을 때 쓰게될것

speaker_id: test

trained model will be save this folder

학습데이터로 학습한 모델을 저장할 장소

work_dir: checkpoints/test

batch size

모델이 한번에 학습할 양을 정한다 (CUDA out of memory에러가 나면 이 숫자를 줄이면 된다)

max_sentences: 10

AMP(Automatic Mixed Precision) setting(only GPU) for less VRAM

AMP를 사용할것인지 설정, 학습시간에 차이는 없지만, 한번에 더 많은 batch를 학습시킬 수 있음.

use_amp: true

thuglife114 commented 1 year ago

diff-svc-main 폴더안에 data 만들고 그안데 /raw/test 이렇게 하던, /test 폴더 만들던 원하는데로 하고 그에 맞게 config 수정하시면 됩니다

sseaon commented 1 year ago

말씀대로해서 해결했습니다 감사합니다!