pln-fing-udelar / covid19-qa

COVID-19 Question Answering
5 stars 4 forks source link

Revisar el procesamiento, que aparecen oraciones como juntas. @sgongora27 #18

Open sgongora27 opened 4 years ago

sgongora27 commented 4 years ago

Desde el JSON ya viene sin saltos de línea. Hay que generarlos de alguna forma.

bryant1410 commented 4 years ago

Sentence Boundary Disambiguation? Podés googlear sobre cómo lo solucionan otros.

sgongora27 commented 4 years ago

Santi ¿vos decís que podríamos hacerle split al texto con Sentence_tokenizer y luego hacerle join con "\n"?

bryant1410 commented 4 years ago

Algo de eso sí.