sooftware / kospeech

Open-Source Toolkit for End-to-End Korean Automatic Speech Recognition leveraging PyTorch and Hydra.
https://sooftware.github.io/kospeech/
Apache License 2.0
605 stars 192 forks source link

초심자 분들을 위한 DeepSpeech2 Pre-trained 모델 공유 드립니다. #154

Open kthworks opened 2 years ago

kthworks commented 2 years ago

안녕하세요, sooftware님께서 좋은 자료를 배포해주셨는데 초심자 분들께 조금이나마 도움이 되고자 글을 올립니다. 저도 초심자라 우여곡절을 겪었지만 다행히 DeepSpeech2 모델 훈련에 성공하여 해당 모델을 공유 드리고자 합니다. 저는 이 모델을 이용하여 실시간 음성을 받아들이고 인퍼런스 할 수 있도록 응용해보았습니다. 솔직히 정확도가 아주 좋지는 않지만, 처음이니까 모델을 훈련시키고 인퍼런스 하는 것에 의의를 두었습니다. 초심자분들께서 간단하게 인퍼런스라도 해보실 수 있다면 좋을 것 같습니다 :)

pre-trained model은 아래 링크로 와주시면 3. How to use에서 구글 드라이브로 연동된 링크를 통해 다운로드하실 수 있습니다. https://github.com/kthworks/KoreanSTT-DeepSpeech2

pre-trained model이 약 200메가 정도가 되어서 용량 제한이 걸렸습니다. git lfs (large file storage)를 이용해서 해결은 해보았으나, 다운을 받을 때도 lfs를 이용해야 제대로 받아지더라구요..ㅠ 그래서 최대한 편하게 사용하실 수 있도록 구글 드라이브로 링크로 대체했습니다. 사용에 관한 방법도 위의 링크에서 확인해보실 수 있습니다!

모델 훈련에 대한 내용은 아래와 같습니다.

Model : DeepSpeech2 Dataset: Ksponspeech GPU: RTX 3080ti CPU: intel i9-12900k 소요시간 : Epoch 당 약 6.5시간 (총 13 Epoch) 훈련 성과 : CER 0.2536

혹시 pre-trained 모델 말고, 직접 학습을 도전하시다가 막히신 분들을 위해서 제가 도움을 많이 받은 mingchin님의 블로그 링크도 아래 달아 두겠습니다. https://mingchin.tistory.com/152

좋은 오픈소스 제공해주신 sooftware님께 다시 한번 감사드리며, kospeech에 도전 중이신 여러분들도 모두 각자의 목표를 달성하시길 응원합니다 !

sooftware commented 2 years ago

너무 좋은 컨트리뷰션 감사합니다!!

sooftware commented 2 years ago

리드미쪽에 적절하게 PR 날려주셔도 감사하겠습니다 :)

kthworks commented 2 years ago

@sooftware 바쁘실텐데 댓글 달아주셔서 감사드립니다!! 깃허브 활동이 아직 익숙치 않아 말씀해주신 것에 대해서 한번 더 여쭙고 싶습니다. Pull Request는 제가 디버깅을 하면서 수정했던 내용을 정리해서 요청 드리는 것으로 알고 있는데, README쪽에 PR을 날린다는 것이 정확히 어떤 의미인가요? 제가 잘 이해를 못했습니다 ㅠㅠ

Pull request의 경우에는 저도 여러 시도를 통해서 성공한 거라 확신이 없어서 요청을 드리기가 굉장히 조심스러운데, 제가 도움이 된다면 말씀해주신 김에 용기를 내어서 전체적인 검토 후에 조금이라도 기여해볼 수 있으면 좋겠습니다 :)

시간 나실 때 답변 해주시면 감사하겠습니다!


PR 요청 드렸습니다. 확인해주시면 감사하겠습니다 :)