demokratie-live / democracy-client

DEMOCRACY App Client
https://www.democracy-deutschland.de/#!prototyp
Apache License 2.0
136 stars 28 forks source link

🚀 [Feature]📱PDF/XML parsing #643

Open ulfgebhardt opened 5 years ago

ulfgebhardt commented 5 years ago

🚀 Feature

[Bundestag.io] PDF/XML parsing

Inhalte des Plenarsaalprotokolls und der Anträge/Gesetzesentwürfe parsen und verfügbar machen.

Design & Layout

Schedule

ManAnRuck commented 5 years ago

drüber gestolpert, jedoch nur überflogen. könnte hilfreich sein

https://medium.freecodecamp.org/how-to-parse-pdfs-at-scale-in-nodejs-what-to-do-and-what-not-to-do-541df9d2eec1

visionmakery commented 5 years ago

Weiteres Feedback via Mitmachen: "PDF-Dokumente sollten aus Datenschutzgründen nicht vom Server dipbt.bundestag.de geladen werden, sondern von einem democracy-deutschland.de-Cache- und Archivserver. Bis zur Implementation dieser Anforderung sollten die PDF-Dokumente zumindest via HTTPS geladen werden und nicht via HTTP!vergl.http://dipbt.bundestag.de/dip21/btd/19/009/1900983.pdfvs.https://dipbt.bundestag.de/dip21/btd/19/009/1900983.pdfSchönen Gruß! "

visionmakery commented 4 years ago

"Hallo,

vielen Dank für eure tolle App und Initiative. Ich habe nur einen Punkt, den ich gern verbessert sehen würde, der nervt mich aber ungemein:

Die PDF Dokumente der Anträge sind zwar zoombar, um eine akzeptable Schriftgröße zu bekommen. Aber sie passen sich dabei nicht der Bildschirmgröße an. Will heißen, es gibt keine automatischen neuen Zeilenumbrüche. Das Lesen der Anträge wird somit umständlich bis zur Nichtnutzung auf Grund von Nervigkeit.

Mir ist bewusst, dass euch die Anträge ggf. nur als eingescannte Dokumente ohne OCR vorliegen, das würde zumindest das Verhalten in der App erklären. Oder eure Readerkomponente ist halt nicht optimal. Vielleicht gibt es ja trotzdem eine Lösung, dieses kritische Feature zu verbessern, damit die Anträge auch lesbar werden.

Vielen Dank,"