Closed sigurdurb closed 4 years ago
Þetta eru einfaldlega allar orðaþrenndir sem koma fyrir í textagrunni Greynis, úr íslenskum fjölmiðlum. Orðin eru þó síuð til að laga algengar stafsetningarvillur, t.d. "aldrey" -> "aldrei". Að öðru leyti eru öll orðin þarna, þar á meðal erlend orð, nöfn, staðaheiti o.s.frv. Ef menn vilja sía út orð sem t.d. er ekki að finna í Beygingarlýsingu íslensks nútímamáls má gera það eftir á ef vill, t.d. með hjálp pakkans ReynirPackage.
Getur verið að það séu orð í fjölmiðlagögnunum sem eru ekki íslensk orð?
Rakst t.d. á orðið "Lerning" sem ég veit ekki til að sé íslenskt orð.
Gat ekki séð á Greyni REAMDE readme skjalinu að það sé sérstaklega tekið fram að þetta séu málfræðilega rétt stafsett orð reyndar, bara að það sé greint niður eftir reglum.