Open alemol opened 5 years ago
Si se puede, la cantidad de sentencias que se pueden obtener correctas depende de la calidad del audio. Esta herramienta es solo una parte, ahora se ocupa segmentar correctamente las oraciones, para eso le recomeindo usar spacy. https://spacy.io/usage
El script para hacer que las sentencias queden ordenas puede quedar algo así:
https://gist.github.com/carlfm01/5acc0ff57900e151aa3783b5cd550a97
Leo los párrafos de archivos y luego escribo las sentencias.
Tengo muchos datos de noticias en español acopladas con su transcripción completa (manualmente generada). Quisiera saber si se puede usar este método para segmentar en audios pequeños y generar data sets para Deep Speech.
Ejemplo de la transcripción:
Enlace al audio