enz / german-wordlist

German wordlist for Tanglet and other wordgames.
Creative Commons Zero v1.0 Universal
22 stars 4 forks source link

Städtenamen in der Liste #5

Open d-mal opened 3 years ago

d-mal commented 3 years ago

Hi, ich hab beim Spielen bemerkt, dass einige Städtenamen in der Liste sind. Die sollten laut Scrabble-Regeln nicht erlaubt sein (Punkt 5 im verlinkten PDF).

Zum Test habe ich aus der Wikipedia-Liste https://de.wikipedia.org/wiki/Liste_der_St%C3%A4dte_in_Deutschland die Namen ohne Zusätze extrahiert, siehe https://gist.github.com/d-mal/7768c8b005f1b33f0d07b4c47af4afb5 Die Überschneidungen sind ziemlich häufig, und nicht nur bei Namen, die auch ein gültiges Wort ergeben (z.B. "Ahlen"). Ich meine, "Ehrenfriedersdorf" ist ziemlich sicher nur ein Städtename ;-)

Häufig findet sich in der Liste noch der Genitiv, z.B. "Eisenach" -> "Eisenachs". Dazu hab ich im Scrabble-PDF nichts genaues gesehen.

enz commented 3 years ago

Kannst du aus der generierten Liste eine erstellen, aus der die Überschneidungen mit gültigen Wörtern entfernt sind? Dann kann ich die gerne aus der Wortliste entfernen und zur Blacklist hinzufügen. Ich hab leider im Moment keine Zeit, selbst daran zu arbeiten.

Genitive und andere Formen von Städtenamen sind meiner Meinung nach nicht erlaubt, z. B. erklärt der Scrabble-Turnier-Checker, dass "Berlins" ungültig ist.

d-mal commented 3 years ago

Ich schau mal, wie weit ich mit einer manuellen Korrektur komme...

Der Scrabble-Turnier-Checker ist ja sehr praktisch, danke für den Hinweis! Ich hatte bis Gestern noch nie die Scrabble-Regeln gelesen, das ist auch mal interessant. Nicht immer super logisch, aber das ist ja auch nicht so einfach ;-)

enz commented 3 years ago

Praktisch ist der Turnier-Checker schon, aber er basiert auf der offiziellen Wörterliste des Vereins, die eine proprietäre Lizenz hat. Deshalb habe ich ja auch mit dieser Liste als freie Alternative angefangen. Außerdem sind in der offiziellen Liste auch Fehler und Lücken.

d-mal commented 3 years ago

Das Forum auf https://www.scrabble3d.info ist auch interessant. Deutsches Sprache, schweres Sprache... Ich denke, es wird nie eine Liste ohne Fehler und Lücken geben. Wenn die Liste aber "FLOSS" ist, können viel mehr Leute an der Verbesserung arbeiten. Deswegen danke für deine Arbeit hier 👍 😄