jymsuper / SpeakerRecognition_tutorial

Simple d-vector based Speaker Recognition (verification and identification) using Pytorch
MIT License
210 stars 46 forks source link

configure.py 부분에서 궁금한 점이 있습니다. #21

Open dhkstnrh opened 1 year ago

dhkstnrh commented 1 year ago

아래 코드의 TRAIN_WAV_DIR 와 DEV_WAV_DIR 부분은 무엇을 의미하고 있는건가요?

Wave path

TRAIN_WAV_DIR = '/home/admin/Desktop/read_25h_2/train' DEV_WAV_DIR = '/home/admin/Desktop/read_25h_2/dev'

jymsuper commented 1 year ago

안녕하세요. WAV_DIR은 feature extraction (wav -> log mel filterbank)를 변환할때 필요한 주소입니다. 하지만 본 코드에선 이미 log mel filterbank feature가 추출되었다고 가정을 하기에 (feature는https://github.com/jymsuper/SpeakerRecognition_tutorial/tree/master/feat_logfbanknfilt40 경로에 존재) WAV DIR은 사용되지 않습니다

dhkstnrh commented 1 year ago

감사합니다!