Open rgonzaleztec opened 8 years ago
Separar de los archivos puros en pdf lo que es texto y lo que es imagen, pudiendo utilizar la parte del archivo que realmente es funcional para analizar
poppler-utils tiene la función pdfimages que permite extraer las figuras. Quizas en Rpoppler hay acceso a ese método.
pdfimages
Separar de los archivos puros en pdf lo que es texto y lo que es imagen, pudiendo utilizar la parte del archivo que realmente es funcional para analizar