hunspell / hunspell

The most popular spellchecking library.
http://hunspell.github.io/
GNU Lesser General Public License v2.1
2.1k stars 235 forks source link

Stemming doubles ending for some Hungarian words (*szerű) #489

Open at-lien opened 7 years ago

at-lien commented 7 years ago

As I realized the following suffix duplication affects all Hungarian words ending 'szerű'

$> echo "példaszerű" | hunspell -s -d hu_HU példaszerű példaszerűszerű

$> hunspell -v @(#) International Ispell Version 3.2.06 (but really Hunspell 1.3.3)

szekedi commented 6 years ago

Using hunspell in R, the same bug appears: hunspell_stem(c("népszerű","nagyszerű","kutyaszerű","példaszerű"), dict="hu_HU")

[[1]] [1] "népszerű" "népszerűszerű"

[[2]] [1] "nagyszerű"

[[3]] [1] "kutyaszerűszerű"

[[4]] [1] "példaszerűszerű"