Edelweiss / beehive

Compile data for Berichtigungsliste
http://www.uni-heidelberg.de/fakultaeten/philosophie/zaw/papy/index.html
MIT License
1 stars 0 forks source link

Sortierreihenfolge für Neue Wörter und Ghostwords #66

Open Edelweiss opened 2 months ago

Edelweiss commented 2 months ago

Formeln können hieraus abgeleitet werden:

https://docs.google.com/spreadsheets/d/1m8ti6e6mRMbrTMy8lDJAqaomeWM1JDE8nyW2rTuOX08/edit?gid=597838776#gid=597838776

Type (*1 000 000) Neues Wort = 4 Ghostword = 8

Topic (* 10 000) Personennamen = 8 Könige, Kaiser, Konsuln 16 Geographisches und Topographisches = 24 Monate und Tage = 32 Religion = 40 Zivil- und Militärverwaltung = 48 Steuern = 56 Berufsbezeichnungen = 64 Allgemeiner Wortindex = 72 Fundorte = 80 Sachen = 88

Lemma Lateinisch (und Demotisch) = 3000 Schadhaft = 7000 Koptisch = 5000 Lateinisch = 2000

UNICODE(C1)

Sowohl neue als auch alte Datenbestände in indexEntry haben inzwischen einen Sort-Parameter, dennoch scheint das Sotieren in der Oberfläche nicht zu funktionieren.

Tatsächlich fehlerhafte Sortierschlüssel für Ghostwords / Geo!!! 0 statt 24 Außerdem auch womöglich falsch Lateinisch/Schadhaft etc. für Neue Wörter; zu prüfen.

Edelweiss commented 2 months ago

Alles so weit erledigt, noch ausstehend:

Außerdem auch womöglich falsch Lateinisch/Schadhaft etc. für Neue Wörter; zu prüfen.

Edelweiss commented 2 months ago

Schadhaft = okay Lateinisch = okay Koptisch = okay Lateinisch (und Demotisch) = okay

Edelweiss commented 2 months ago

Missing Unicode-Point

SELECT * FROM index_entry WHERE sort like '____000%' ORDER BY sort ASC

only for Schadhaft, Koptisch & Co. => on purpose?

Edelweiss commented 1 month ago

https://github.com/Edelweiss/beehive/wiki/Ghostwords-&-Co.

Edelweiss commented 1 month ago

Im Wiki findet sich nun eine Dokumentation zur Bildung des Sortierschlüssels. (siehe oben)

Dass Schadhaft, Koptisch & Co. keinen Unicode-Point haben, ist Absicht.