falabrasil / kaldi-br

☕🇧🇷 Scripts para o Kaldi em Português Brasileiro
MIT License
47 stars 7 forks source link

Atualizando o modelo do vosk #14

Closed gabrielroses15 closed 6 months ago

gabrielroses15 commented 6 months ago

Olá bom dia, eu gostaria de saber como consigo pegar áudios e suas transcrições manuais para adicionar este conteúdo no conteúdo do modelo do vosk, pois gostaria de adicionar conteúdo e "treinar" o vosk com mais áudios e transcrições, existe uma pasta onde eu coloque os áudios, suas respectivas transcrições e rode algum programa para transformar isto em um modelo do vosk?

cassiotbatista commented 6 months ago

Oi,

Sim, mas precisas aprender a usar o Kaldi, o que nao e' tao trivial. A recomendacao e' comecar pela recipe com a LapsBM (fb-lapsbm): https://github.com/falabrasil/kaldi-br?tab=readme-ov-file#model-training-for-speech-recognition-vosk--lapsbm

Ver tambem: https://alphacephei.com/vosk/models#training-your-own-model

gabrielroses15 commented 6 months ago

Só consigo fazer isto em um SO linux?