estefaaa02 / ERL

0 stars 0 forks source link

Procesamiento de texto #4

Open estefaaa02 opened 3 years ago

estefaaa02 commented 3 years ago

Pasos para preparar texto para NLP

  1. Tokenizar Fraccionar todo el texto que tengamos en palabras
  2. Convertir a minúscula
  3. Eliminar acentos
  4. Eliminar stop-words (artículos, pronombres, preposiciones, etc)
  5. Eliminar caracteres repetidos
  6. Eliminar caracteres especiales
  7. Procesar negaciones (Algoritmo de Potts)
    • "no", "tampoco", "nadie", "jamás", "ni", "sin", "nada", "nunca", "ningún", "ninguno" y "ninguna”
  8. Eliminar signos de puntuación Transfor
estefaaa02 commented 3 years ago

Pasos realizados

  1. Tokenizar Fraccionar todo el texto que tengamos en palabras image

  2. Eliminar acentos y signos de puntuación image

    image

  3. Eliminar stop-words image

estefaaa02 commented 3 years ago

Speech to text

![Uploading image.png…]()

estefaaa02 commented 3 years ago

Librerías utilizadas

SpeechRecognition pyAudio google-cloud-speech