BoboTiG / ebook-reader-dict

Finally decent dictionaries based on the Wiktionary for your beloved eBook reader. Daily updates & 14 locales supported so far.
http://www.tiger-222.fr/?d=2020/04/17/22/14/21-un-dictionnaire-alternatif-et-complet-pour-votre-liseuse
MIT License
425 stars 24 forks source link

[CA] List of failing words in Catalan #1982

Open lasconic opened 9 months ago

lasconic commented 9 months ago

144 failing words after running the following. On 391541 words.

python -m wikidict ca --check-words --count 400000 

You will spot most of the greek letters, and these words would be fixed by https://github.com/BoboTiG/ebook-reader-dict/issues/1975

Others are chinese, japanese, iberic transliterations and some corner cases. Each word needs to be investigated. The list can be ran through

python -m wikidict ca --check-words --input=list.txt
Adrar
Alborx
Arles
Atzeneta
Badalona
Barcelona
Bas
Basturs
Begues
Belarús
Besòs
Bonanat
Bor
Cotlliure
Elna
Elx
Eufràsia
Europa
Fraga
Ger
Girona
Guissona
Huawei
Isona
Kirguizistan
Kirguizstan
Kíiv
Lleida
Marroc
Marràqueix
Mequinensa
Osca
Sanitja
Segarra
Senija
Tarragona
Ter
Tàrrega
Ucraïna
Urgell
Valira
Xestalgar
Xiaomi
Xàtiva
amazic
anècdota
avajó
avarca
barca
barraca
belarús
bony
borrasca
codeïna
conversació
coreografia
corpus
cosac
delta
diftèria
diürètic
doncs
endengat
ergatiu
escopofília
esquerre
etiopatogènia
eta
exemplar
fi
fideu
flaó
fornicar
genet
germinal
glicoràquia
glucoràquia
go
granota
hrívnia
iber
iota
jiaozi
kappa
karaoke
khi
kirguís
ksi
lambda
lecte
mam
mameluc
marraixa
mesquita
metge
mi
milionari
mostatxo
musulmà
nabiu
nabís
neperià
ni
omega
ora
oreo
pantà
panxa
pi
piloriza
psi
ro
romaic
sacre
sigma
sirtaki
sistre
sitja
tagarot
taixelhit
talibà
tamazic
tarifit
tau
tavanta
tecla
theta
tifinag
tsundoku
ventre
wabi-sabi
won
xarlotada
xavacà
xenisme
xiaolongbao
xinxa
yazidisme
zen
zenata
zeta
àrab
ípsilon
òmicron

Upvote & Fund

Fund with Polar