humlab-sead / sead_browser_client

Online browser client for the SEAD database
2 stars 0 forks source link

Bibliography modern filter: sorteringsordningen är lite skum #243

Open Maanin00 opened 1 year ago

Maanin00 commented 1 year ago

Först kommer ett antal tomma poster, sen kommer några poster i oordning innan siffror och sen A inleder den rätta sorteringen. Det är även ett antal poster i slutet av listan som sorteras annorlunda exempelvis http-poster hamnar inte under h och diakritiska tecken läggs sist. En större fråga väcks här: hur ska diakritiska tecken sorteras? När är såna en egen bokstav och när är det en variant på en bokstav? Se https://sv.wikipedia.org/wiki/Diakritiskt_tecken

bild

johanvonboer commented 1 year ago

Har tittat lite på detta och det beror på 'skräpigt' data i databasen.

Ips typographus... är en sträng som börjar med en tabb. Resten av strängarna ner till 'British... börjar med ett mellanslag. Därav att sorteringsordningen blir som den blir.

Dessa tabbar och mellanslag syns dock inte eftersom de strippas ut från själva renderingen.

Att http-länkar hamnar långt ner skulle jag tro beror på att de börjar med liten bokstav.

Jag kan fixa dessa två saker på klientsidan (de borde dock fixas även i databasen längre fram).

Dock finns det andra poster som är mer problematiska, t.ex. den här posten (ArtDatabanken): image Ser egentligen ut så här i databasen, d.v.s. den är inlagd som en tagg: image

Och hamnar därför konstigt i sorteringsordningen. Detta är saker som antagligen bör fixas i databasen.

Maanin00 commented 1 year ago

Ska jag göra ett nytt ärende för ändring i db? Det gäller tbl_biblio, va?

johanvonboer commented 1 year ago

Ja, gärna. Man skulle nog behöva göra något enkelt script för att gå igenom den tabellen och ta bort alla eventuella \n och \t framför strängarna och ta bort tagg-tecknen "<" ">" där de finns.

johanvonboer commented 1 year ago

It was decided that @visead will make a new view for fetching the correct data.

johanvonboer commented 1 year ago

We also need a tooltip showing the complete title and authors