IRIS-AUDIO / SELD

7 stars 8 forks source link

add vad_dataloader #113

Closed daniel03c1 closed 3 years ago

daniel03c1 commented 3 years ago

VAD 위한 데이터 불러오는 코드를 작성하였습니다. 작동 방식은 다음과 같습니다.

  1. wav, label 이름들을 불러옵니다. (load_vad_wavs_and_labels)
  2. 각 wav 별로 랜덤으로 32개 윈도우를 선별하여 생성합니다 (get_vad_dataset)

윈도우 생성하면 1채널 음성이기에 [n_frames, n_mels, 1]의 형태로 출력을 하는 데이터셋을 얻는데, 그 이후부터는 기존에 data_loader에서 정의해둔 data_loader를 사용하면 되기 때문에 따로 추가하지 않았습니다.