swissbib / contentCollector

used to collect the whole content provided by swissbib
3 stars 0 forks source link

Löschmechanismus für regelmässige "manuelle" Löschungen #5

Open oschihin opened 9 years ago

oschihin commented 9 years ago

Problem

Bei OAI-Repositories, die keine Informationen über Löschungen publizieren (siehe http://www.openarchives.org/OAI/openarchivesprotocol.html#DeletedRecords), können regelmässig oder unregelmässig Listen mit zu löschenden Records erstellt werden. Aktuell besteht ein Mechanismus, der diese Listen auf CBS einstellt, damit die Records dort gelöscht werden. Die Records verbleiben dabei aber im Rohdatenspeicher / MongoDB. Diese enthält damit weiterhin eigentlich gelöschte Sätze.

Task

Akut ist der Fall SNL. Wir erhalten monatlich eine Liste mit n Aufnahmen des Status deleted: Zwei Records per Mail

Record ID: 732319
Username: yb
Timestamp: 15-JUL-2015 09:29:46
Bibliographic Level: m
Record Type: a
Record State: Deleted

Record ID: 1787785
Username: sib
Timestamp: 15-JUL-2015 11:10:58
Bibliographic Level: m
Record Type: a
Record State: Deleted

Daraus erstellte delete-Liste für CBS (Skript zur Erstellung dieser xml-Struktur liegt im internen Repo 'cbs')

<collection>
<record><header status="deleted"><identifier>vtls001708042</identifier></header></record>
<record><header status="deleted"><identifier>vtls001771693</identifier></header></record>
</collection>
guenterh commented 9 years ago

@oschihin

Günter

oschihin commented 8 years ago

@guenterh @witzigs Das Outputformat für die Löschungen in CBS ist noch nicht korrekt:

Das Verfahren ist deshalb in der crontab auf coai1 ausgeschaltet