robbi5 / kleineanfragen

Collecting kleine Anfragen from Parlamentsdokumentationssystemen for easy search- and linkability
https://kleineanfragen.de
MIT License
43 stars 9 forks source link

Rewrite Sachsen Scraper #104

Open robbi5 opened 8 years ago

robbi5 commented 8 years ago

Da der Sachsen Scraper zu viel Last auf dem Parlamentsdokumentationssystem erzeugt, sollten wir:

Da trotzdem der Scrapevorgang immer noch recht aufwändig ist (klickt sich durch relativ viele Formulare/Seiten, bis alle Metainformationen zusammengesammelt) macht es Sinn, zu prüfen, ob eine API im Sachsener Parlamentsdokumentationssystem bereitgestellt werden kann.

Benötigte Daten aus der API:

Erster Import

Zur PDF-URL: Aktuell erfolgt ein Rehosting der PDFs bei kleineanfragen.de, da die URL zum PDF im Parlamentsdokumentationssystem nur funktioniert, wenn vorher die Anfrage im Viewer auch angezeigt wurde.

Die API sollte bestmöglich stateless und ohne Authentifizierung sein und auf REST mit JSON-Dokumenten basieren.

Andere (whsl. sinnvollere) Möglichkeit: Implementation von OParl, ein Standard für offenen Zugriff auf parlamentarische Informationssysteme.