gbv / coli-ana

API to analyze DDC numbers
https://coli-conc.gbv.de/coli-ana/app/
MIT License
2 stars 0 forks source link

Failed to parse backend for 784.188851224091821 #35

Closed nichtich closed 3 years ago

nichtich commented 3 years ago

https://coli-conc.gbv.de/coli-ana/dev/?notation=784.188851224091821&mode=analyze returns an outdated result.

This works: ./bin/convert.js <(echo 700.23 | netcat -N esx-89.gbv.de 7070)

This works: echo 784.188851224091821 | netcat -N esx-89.gbv.de 7070

This does not ./bin/convert.js <(echo 784.188851224091821 | netcat -N esx-89.gbv.de 7070)

stefandesu commented 3 years ago

This is what the analysis looks like:

784.188851224091821 (ul629)
7------------------ Künste und Unterhaltung (notation: 7)
78----------------- Musik (notation: 78)
784---------------- Instrumente und Instrumentalensembles und ihre Musik (notation: 784)
784.1-------------- Allgemeine Prinzipien, musikalische Formen, Instrumente (notation: 784.1)
784.18------------- Musikalische Formen (notation: 784.18)
784.188------------ Instrumentalformen #dno_span_cen# (notation: 784.183-784.189)
784.188------------ †Tanzformen (notation: 784.188)
784.1888----------- †Lateinamerikanische Tanzformen (notation: 784.183-784.189)
784.18885---------- †Tangos (notation: 784.183-784.189)
---.-----1--------- Allgemeine Prinzipien (notation: 781.2-781.8:1)
---.------2-------- *Musikalische Grundbegriffe (notation: 781.2)
---.------2-------- Andere Prinzipien und musikalische Formen #dno_span_cen# (notation: 781.2-781.8)
---.------22------- *Tempo (notation: 781.22)
---.------224------ *Rhythmus (notation: 781.224)
---.------224------ *Rhythmus (notation: 781.224)
---.---------09---- Standardschlüssel (notation: 781.2-781.8:09)
---.---------0----- Musik (notation: 780)
---.---------09---- Geschichte, geografische Behandlung, Biografien #dno_syn# (notation: 780.9)
---.---------0----- Hilfstafel 1. Standardschlüssel (notation: T1--0)
---.---------09---- Geschichte, geografische Behandlung, Biografien (notation: T1--09)
---.---------091--- Gebiete, Regionen, Orte im Allgemeinen (notation: T1--091)
---.------------8-- Andere Arten von Regionen auf der Erde (notation: T2--18)
---.------------82- Ozean- und Meeresbecken (notation: T2--182)
---.------------821 Atlantischer Raum   Okzident (notation: T2--1821)

It contains an error: The line ---.------224------ *Rhythmus (notation: 781.224) is duplicated. Currently, the whole analysis is discarded in this case:

https://github.com/gbv/coli-ana/blob/1433c5c2f661c317c48672167ddc4ddd722863ba/lib/parseInputStream.js#L92-L96

So it's not a bug. The question is whether we add an exception for particular cases like this, or whether this is intended behavior.