sooftware / kospeech

Open-Source Toolkit for End-to-End Korean Automatic Speech Recognition leveraging PyTorch and Hydra.
https://sooftware.github.io/kospeech/
Apache License 2.0
605 stars 192 forks source link

DeepSpeech2 모델에 대한 PR 날려드립니다. #157

Closed kthworks closed 2 years ago

kthworks commented 2 years ago

안녕하세요, soofware님. 제가 Ksponspeech dataset을 이용해서 DeepSpeech2 모델을 훈련 시키는 과정 중에 수정했던 사항들을 반영해서 PR 날려드립니다. 수정한 내용은 총 3가지이며, 확인해주시면 감사하겠습니다.

1. kospeech 폴더를 bin 폴더 안으로 집어 넣었습니다. (kospeech폴더에 대한 경로가 이슈가 있는데 bin 폴더 안으로 집어 넣었을 때 다른 상대 경로들도 함께 해결이 되었습니다. )

2. /bin/kospeech/models/init.py의 line 32, BeamDecoderRNN import부분 삭제 (존재하지 않는 라이브러리) 모델 훈련을 시킬 때 LAS 모델쪽에 포함되어있던 BeamDecoderRNN 라이브러리가 존재하지 않아 import가 되지 않으면서 에러가 생겼고, 이 부분을 삭제했습니다.

3. train/validation 개수 조정 (kspon): /bin/kospeech/data/data_loader.py의 line 266에서 train_num = 620000, valid_num = 2545 -> train_num = 600000, valid_num = 22545로 변경 기존 ksponspeech dataset에 대한 train/validation 개수로 했더니 오류가 생겨서, 위와 같이 조정했더니 해결되었습니다.

조금이나마 도움이 되었으면 좋겠습니다. 감사합니다 :)

sooftware commented 2 years ago

감사합니다만, 2번에 대한 부분은 수정했고, 1번의 경우는 파이썬 스크립트 실행 위치를 잘못하신 것 같습니다. 3번의 경우는 갯수 때문에 문제가 생긴다는 점이 의아하네요.