G5-EIT-VR-Landsby / STT

MIT License
0 stars 0 forks source link

L2: STT #3

Open vyjur opened 5 months ago

vyjur commented 5 months ago

Norsk OpenAI Whisper med Voice Activity Detection (VAD) og realtime

vyjur commented 5 months ago

Funker nå med å bruke WhisperLive. Ser ut som GPU prosessere mye raskere (har bare testet modell small). Muligens bra mikrofon gjør at det blir bedre.

Ser at du kan laste ned modeller, så kan være vi kan endre på source koden til WhisperLive og legge til den norske modellen fra

https://github.com/NbAiLab/nb-whisper/ https://huggingface.co/NbAiLab/nb-whisper-small-beta