-
참고링크
- https://github.com/NVIDIA/NeMo
- https://docs.nvidia.com/deeplearning/nemo/user-guide/docs/en/main/starthere/tutorials.html
-
Currently, emacs-jupyter display audio/video object itself.
```python
#+begin_src jupyter-python :session tqdm :async yes
import IPython.display as ipd
import numpy
sr = 22050 # sample rate…
-
현재 공개 스피치 데이터셋의 경우 전사 데이터를 취합하면, 이 역시 코퍼스로 활용이 가능한데 계획이 있으신지 문의합니다. (승인을 통해 사용이 가능한 데이터셋입니다)
- ~AIHub 음원 데이터 1000hr. 분량~ #196 반영
- ClovaCall 음원 데이터 200hr. 분량
-
# ❓ Questions & Help
안녕하세요, conformer-lstm 모델로 ksponspeech dataset train 코드를 돌려보던 도중 아래와 같은 에러가 발생하여 질문 남깁니다.
처음에 default batch size 32 로 돌렸을 때 CUDA memory out of range 가 나서 bacth size 1로 돌렸을 때 발생…
-
안녕하세요, sooftware님께서 좋은 자료를 배포해주셨는데 초심자 분들께 조금이나마 도움이 되고자 글을 올립니다.
저도 초심자라 우여곡절을 겪었지만 다행히 DeepSpeech2 모델 훈련에 성공하여 해당 모델을 공유 드리고자 합니다.
저는 이 모델을 이용하여 실시간 음성을 받아들이고 인퍼런스 할 수 있도록 응용해보았습니다.
솔직히 정확도가 아주 좋…
-
I am not familiar with ASR tasks, so I'd be so glad if anyone answer my question:
I am training ContextNet which is basically rnn-t type model as in the original paper.
Because I need only encoder…
-
# ❓ Questions & Help
hello
I'm going to test it with Ksponspeech.
However, there is a problem with the dataloder part.
How can I solve this?
## Details
dataset=ksponspeech
dataset.d…
-
### Describe the bug
While [testing recipes](https://github.com/speechbrain/speechbrain/pull/1600#issuecomment-1335378632), it came up that a references HF repo was turned private.
Repository Not …
-
hello!!
I am learning with Ksponspeech.
In the evaluation (eval data) part after trainning,
ValueError xxxxxxxxxxxxx.pcm is not Valid!! An error occurs.
Has anyone experienced the …
-
# ❓ Questions & Help
I'm trying to train using ksponspeach data, is there a reason why you set the number of trains and validations as follows?
## Details
I'm curious why you divided it like th…