MyCoRe-Org / pica2mods

GNU General Public License v3.0
0 stars 0 forks source link

Function sortableSortstring #10

Closed rsteph-de closed 3 years ago

rsteph-de commented 3 years ago

Der Sortierstring bei Zählungen von MBW, Zeitschriften und Reihen ist nicht trivial durch Maschinen sortierbar. Dies soll durch Anwendung verschiedener Heuristiken erreicht werden.

PicaFeld: /p:record/p:datafield[@tag='036D' or @tag='036F' or @tag='036M']/p:subfield[@code='X']

Algorithmus-Idee: 1) Gruppenbildung durch Trennung an Punkt und Komma 2) Je Gruppe: a. Entferne Klammern: ()[]{} b. Wenn Zahl - dann mit führenden Nullen erweitern auf 4 Stellen c. Wenn mit Zahl(en) anfängt (Fälle „1-2“, oder „4/5“)

Beispiele: [1].1759 -> 0001-17159 7,[3],2.1732 -> 0007-0003-0002-1732 1916,Nachtrag -> 1916-nachtrag_ 4/5.1709 -> 0004-1709 1032604220 -> 1032604220 S,01-> s____-0001 Suppl1 -> suppl1____ 181300000 -> 181300000