Open marians opened 12 years ago
Hier sind die Gründe der Entstehung der langen Liste der Stadt Köln wichtig. Offenbar hat eine intern verwendete Oberfläche dazu ermutigt mehrere Daten zusammen zu packen, die besser separat sein sollten. Und teilweise sind die Elemente der Liste sogar redundant (BV=Bezirksvertretung). Eine Normalisierung halte ich deshalb für angebracht. Die Rohdaten können allerdings eventuell bei einer Plausibilitätsprüfung helfen (Dringlichkeitsvorlage BV in Ausschuss statt in BV).
Für eine solche "normalisierte" Eigenschaft kann demnächst https://github.com/opengovld/skos verwendet werden.
Die Art des Dokuments kann in der Original-Quelle, im Ratsinformationssystem der Stadt Köln, nahezu beliebige Werte annehmen. Hier sind die aktuell vorkommenden Typen:
Da hier viele verschiedene Formulierungen für ein und denselben Typen verwendet werden, werden diese Formulierungen für die Suche durch solr_import.py normalisiert, so dass die folgenden Typen übrig bleiben:
Das führt aktuell dazu, dass bei der Suche Anhand des Felds
type
die normalisierten Werte benutzt werden können/müssen.Die ausgegebenen Dokumenteneigenschaften, die über die API-Funktion /api/documents für die Dokumenteneigenschaft
type
zurück gegeben werden, sind jedoch nicht normalisiert und entsprechen einem der Werte in der oberen Liste.Eine Lösung wäre, die Dokumenteneigenschaft
type
grundsätzlich zu normalisieren. Damit geht jedoch Information verloren.Die andere Möglichkeit wäre, sowohl die Original-Typbeschreibung als auch die normalisierte Beschreibung als jeweils eigene Dokumenteneigenschaft abzulegen. Damit ginge kein Detail verloren.
Meinungen hierzu bitte gerne in den Kommentaren!