akramer-zibra / einblick-stuttgart

GNU Affero General Public License v3.0
0 stars 0 forks source link

PDF-Dokumente scrapen für mehr inhaltliche Informationen #16

Open akramer-zibra opened 4 years ago

akramer-zibra commented 4 years ago

pdf2json bietet sich als Modul an. Das npm Package ist allerdings nicht auf dem aktuellsten Stand... Besser direkt die eine stabile Version/Commit aus dem Github Repository benutzen: npm install --save modesty/pdf2json#cb3a83b

akramer-zibra commented 4 years ago

jsonpath ist womöglich eine gute Ergänzung, um gezielt bestimmte Daten aus der json Struktur rauszuholen.
Vielleicht lohnt sich sogar auf die erweiterte Version jsonpath-plus aufzuspringen. jsonpath-plus unterstützt caching