OPUS4 / opus4-search

OPUS 4 Solr search.
Other
1 stars 4 forks source link

Shell-Skript erstellen, das die IDs der Dokumente ausgibt, die im Index nicht aktuell sind #76

Open j3nsch opened 2 years ago

j3nsch commented 2 years ago

Nach dem Einführen des Index-Felds server_date_modified (siehe OPUSVIER-2372) könnten über ein Skript die IDs der Dokumente ermittelt werden, die im Index nicht up-to-date sind.

j3nsch commented 2 years ago

Die Frage ist, ob ein solches Skript überhaupt noch benötigt wird, da die gesamte Konsistenzprüfung nun bequem innerhalb der Administration gestartet und ausgewertet werden kann.

j3nsch commented 2 years ago

Eine Prüfung des Index ist sicherlich immer noch sinnvoll. Die Umsetzung sollte als Command für bin/opus4 erfolgen.

ServerDateModified ist kein ausreichendes Kriterium, weil es nicht bei allen Änderungen aktualisiert wird. ServerDateModified wird seit langem als Zeitstempel für die letzte Änderung von "relevanten Metadaten" verwendet, damit die DNB die Dokumente nicht erneut geliefert bekommt, wenn sich lediglich interne Informationen geändert haben. Für eine sinnvolle Lösung muss es einen Zeitstempel geben, der immer aktualisiert wird.