krunose / hunspell-hr

Hunspellov rječnik za hrvatski
29 stars 10 forks source link

Rječnik za računalnu provjeru pravopisa hrvatskoga jezika Hunspellom

Rječnik za računalnu provjeru pravopisa skup je pravila koja omogućuju računalnu provjeru pravopisa hrvatskoga jezika alatom Hunspell. Rječnik čine dvije datoteke: popis riječi nalazi se u hr_HR.dic, a pravila za stvaranje oblika riječi nalazi se u datoteci hr_HR.aff.

Sve ostalo je opis projekta, dokumentacija ili alat(i) za njegovo održavanje i ne koristi se za provjeru pravopisa.

Rječnik nije Hunspell i nije njegov dio. Pravila postoje neovisno o njemu, ali i drugim aplikacijama koja za računalnu provjeru pravopisa koriste Hunspell i ova pravila, zato različite aplikacije mogu imati različite inačice istoga rječnika ili pak potpuno različite rječnike: različiti izvori, popisi rječi i pravila za razradu oblika, a bez ikakve međusobne koordinacije. Za ažuriranje rječnika pojedinih aplikacija zaduženi su isključivo održavatelji dodataka pojedine aplikacije ili njezini razvijatelji. Nasreću i nažalost, u slučaju hrvatskoga jezika riječ je o različitim inačicama istoga rječnika.

Izvornu inačicu napravio je Denis Lacković 2003. g.; dostupna je na cvs.linux.hr/spell. Dodavati riječi počeo sam 2014. g., ali za ispravljanje, dopunjavanje i unaprjeđenje – onako kako to izgleda danas – zaslužan je Mirko Kos (2016.) Većim brojem riječi doprinio je i Boris Jurić (2017.) [^1]

Sadržaj repozitorija

Kako dodati novu riječ u rječnik

Nažalost, ne postoji automatiziran način dodavanja riječi. S jedne strane zato što nove riječi nema u rječniku pa nema reference za provjeru, a s druge strane zbog velikog broja klasa, kombinacija klasa i broja oblika u klasama, pa automatizirano dodavanje ne može biti precizno i potrebna je ručna provjera.

Nove riječi primam na kruno.se na domeni gmx com, ali bilo bi dobro kada bi naslov takve poruke bio "Rječnik hr_HR: dodavanje riječi" radi filtriranja i naknadnoga pretraživanja.

Onaj tko ima račun na GitHubu i želi dodati pridjev "riječni", može

Svjestan sam da bi ove upute mogle više pitanja otvoriti negoli zatvorit, pa ću rado odgovoriti na mejl. Od pomoći može biti i sljedeće:

Postoji i nešto što se zove ProofingToolGui iliti PTG, izgleda prilično dobro, ali nisam radio s time.

[^1]: Ako sam koga izostavio ili želi kakvu izmjenu, može me kontaktirati na kruno.se na domeni gmx com.

[^2]: Prilikom preuzimanja rječnika, bezobrazno sam promijenio sadržaj datoteke README_hr_HR.txt. Sada se u ovoj datoteci nalazi njezin izvorni sadržaj.

[^3]: U tom kontekstu spominju se unmunch, unmunch.sh te wordform. Navodno, ovo posljednje radi s Hunspellom, ali za pojedinu riječ. Možda bi se mogla napraviti skripta koja bi za svaku riječ u rječniku pozivala wordform, ali u danom trenutku bilo mi je previše za prožvakati (github.com/hunspell/issues/404, hunspell/src/tools/wordforms).