infinite-dao / werkzeuge-woerterbuchnetz-und-andere

Einige Werkzeuge und Abfrageprogramme (für Linux oder MAC), um aus dem https://woerterbuchnetz.de Wörter abzufragen, z.B. über die Programm-Schnitt-Stelle (PSS oder engl. API).
GNU General Public License v3.0
0 stars 0 forks source link

Anliegen: Grimm Grammatik-Angaben übersetzen gemäß Schottel 1663, Wahrig 1990 u.ä. #2

Open infinite-dao opened 1 year ago

infinite-dao commented 1 year ago

Die vielen Grammatikeinträge im Grimm-Wörterbuch sollten möglichst gut übersetzt werden in gutes Deutsch, z.B. Begriffe aus Schottel 1663 (https://www.digitale-sammlungen.de/de/view/bsb11346535?page=776 ) oder ähnliche, mit Betonung auf gut verständlich.

Alle vorhandenen Einträge lassen sich wie folgt abfragen:

# alle Lemmata abfragen (!! 17 MB groß)
wget "https://api.woerterbuchnetz.de/dictionaries/DWB/lemmata/select/*/0/json" \
  --output-document="alle_Lemmata_api.woerterbuchnetz.de.json"
# JSON formatieren (besser lesbar)
jq '.' alle_Lemmata_api.woerterbuchnetz.de.json \
  > alle_Lemmata_api.woerterbuchnetz.de.formatiert.json

Daten erst einmal anschauen, z.B. das 123. JSON-Objekt anzeigen lassen

jq '.[123]' alle_Lemmata_api.woerterbuchnetz.de.formatiert.json
{
  "value": "A00120",
  "label": "abbrand",
  "gram": "m."
}

Einen bestimmten Grammatik-Wert abfragen, z.B. tr., und als Stichpunkte ausgeben:

jq -r ' (.|sort_by(.gram))[]
  | if .gram == "tr."
  then "- \(.label) (\(.gram), https://www.woerterbuchnetz.de/DWB?lemid=\(.value))"
  else empty
  end' alle_Lemmata_api.woerterbuchnetz.de.formatiert.json # | head -n 20

Nun alle Grammatik-Werte zusammenfassen:

# nur die Grammatikeinträge sammeln
jq '. | unique_by(.gram)' alle_Lemmata_api.woerterbuchnetz.de.formatiert.json \
  > gram_alle.json
# gesammelte eineinzige Grammatikeinträge ausgeben
jq '.[].gram' gram_alle.json
# als Markdown-Liste
jq -r ' (.|sort_by(.gram))[]
  | if .gram == "" or .gram == null
  then empty 
  else "- `\(.gram)`"
  end' gram_alle.json

Die Liste (man beachte die HTML-Codierung der Umlaute):

infinite-dao commented 1 year ago

Gruppierter Versuch:

(3er- bis vielfach-Angaben sollten eher nachgeprüft werden)

(2er Angaben sollten überprüft werden)

(3er- bis vielfach-Angaben sollten eher nachgeprüft werden)

Problemfälle