sk-spell / hunspell-sk

Slovak dictionary for hunspell
Mozilla Public License 2.0
19 stars 7 forks source link

SFX D #33

Open zdenop opened 3 years ago

zdenop commented 3 years ago

Aha, to isté tu:

SFX D   eň          ňam        ec is:dative is:plural

Originally posted by @andrewshadura in https://github.com/sk-spell/hunspell-sk/issues/32#issuecomment-774670691

zdenop commented 3 years ago

@andrewshadura: počkám, či nájdeš viac, aby som to nerobil po jednom riadku ;-)

andrewshadura commented 3 years ago

The condition "[^s][ey][lľ]" does not guarantee that "ľ" can always be stripped.

SFX D   ľ           liam       [^s][ye][ľl] is:dative is:plural
andrewshadura commented 3 years ago
--- sk_affix.dat.orig   2021-02-07 14:55:31.395919429 +0100
+++ sk_affix.dat    2021-02-07 14:56:28.980340792 +0100
@@ -293,7 +293,7 @@
 SFX U   a           iach       [^ďťňľi]a is:locative is:plural
 SFX U   a           ami        a is:instrumental is:plural

-SFX D Y 201
+SFX D Y 197
 SFX D   ec          ce         ec is:genitive
 SFX D   ď           de         ď is:genitive
 SFX D   eľ          le         seľ is:genitive
@@ -384,7 +384,6 @@
 SFX D   ď           diam       [^i]aď is:dative is:plural
 SFX D   ň           niam       lebeň is:dative is:plural
 SFX D   ň           niam       [alou]ň is:dative is:plural
-SFX D   ň           niam       eňa is:dative is:plural
 SFX D   ň           niam       čeň is:dative is:plural
 SFX D   ň           niam       jeseň is:dative is:plural
 SFX D   ň           niam       [^á]leň is:dative is:plural
@@ -406,8 +405,7 @@
 SFX D   eň          ňam        priazeň is:dative is:plural
 SFX D   eň          ňam        báseň is:dative is:plural
 SFX D   eň          ňam        i[ae]reň is:dative is:plural
-SFX D   eň          ňam        ec is:dative is:plural
-SFX D   ľ           liam       [^s][ye][ľl] is:dative is:plural
+SFX D   ľ           liam       [^s][ye]ľ is:dative is:plural
 SFX D   el          liam       sel is:dative is:plural
 SFX D   eľ          liam       myseľ is:dative is:plural
 SFX D   eľ          le         seľ is:accusative is:plural
@@ -456,7 +454,6 @@
 SFX D   ď           diach      [^i]aď is:locative is:plural
 SFX D   ň           niach      lebeň is:locative is:plural
 SFX D   ň           niach      [alou]ň is:locative is:plural
-SFX D   ň           niach      eňa is:locative is:plural
 SFX D   ň           niach      čeň is:locative is:plural
 SFX D   ň           niach      jeseň is:locative is:plural
 SFX D   ň           niach      [^á]leň is:locative is:plural
@@ -478,8 +475,7 @@
 SFX D   eň          ňach       priazeň is:locative is:plural
 SFX D   eň          ňach       báseň is:locative is:plural
 SFX D   eň          ňach       i[ae]reň is:locative is:plural
-SFX D   eň          ňach       ec is:locative is:plural
-SFX D   ľ           liach      [^s][ye][ľl] is:locative is:plural
+SFX D   ľ           liach      [^s][ye]ľ is:locative is:plural
 SFX D   el          liach      sel is:locative is:plural
 SFX D   eľ          liach      myseľ is:locative is:plural
 SFX D   ec          ciach      ec is:locative is:plural
zdenop commented 3 years ago

s týmito zmenami už je možné spraviť aspell slovník?

andrewshadura commented 3 years ago

Áno, idem to teraz dať do Debianu (experimental). Žiaľ, aspell nepoužívam, tak neviem to poriadne skontrolovať (cc @pali znova 🙂) Ak by to dobre fungovalo, tak dám rovno to unstable 🙂

pali commented 3 years ago

aspell stále používam, ak bude k dispozícii deb/dsc balík tak ho na debiane otestujem. o pár dní bude freeze balíkov debiane, tak by bolo dobré ho stihnúť zaradiť.

andrewshadura commented 3 years ago

Keď sa zbuilduje, môžeš to rovno aj apt install :slightly_smiling_face:

pali commented 3 years ago

Balík sa nainštaloval ale vypisuje warning pri inštalácii:

(Číta sa databáza ... momentálne je nainštalovaných 463726 súborov alebo adresárov.
Preparing to unpack .../aspell-sk_2.02-0-6_all.deb ...
Unpacking aspell-sk (2.02-0-6) over (2.02-0-1.1) ...
Nastavuje sa balík aspell-sk (2.02-0-6) ...
Processing triggers for dictionaries-common (1.28.1) ...
aspell-autobuildhash: processing: sk [sk].
Upozornenie: The word "nie sú" is invalid. Znak ' ' (U+20) sa nesmie vyskytovať uprostred slova. Preskakujem slovo.
pali commented 3 years ago

Dal som ho spustiť na rôzne texty čo som písal a vyzerá, že funguje všetko ako má.

andrewshadura commented 3 years ago

Hmm, zvláštne je to, keď to zbuildujem lokálne, nevidím tento problém.

andrewshadura commented 3 years ago

Aha, LC_ALL=C pomohlo.

andrewshadura commented 3 years ago

Ok, bol to problém v skripte, ktorý robil konverziu.

pali commented 3 years ago

Už to nevypisuje warning pri inštalácii:

(Číta sa databáza ... momentálne je nainštalovaných 463726 súborov alebo adresárov.
Preparing to unpack .../aspell-sk_2.02-0-7_all.deb ...
Unpacking aspell-sk (2.02-0-7) over (2.02-0-6) ...
Nastavuje sa balík aspell-sk (2.02-0-7) ...
Processing triggers for dictionaries-common (1.28.1) ...
aspell-autobuildhash: processing: sk [sk].
zdenop commented 3 years ago

verzia 2.02-x-x urcite nie je ok. https://github.com/sk-spell/hunspell-sk/blob/da16fb8c360b3d813b7eec0b8949df1b2a950198/sk_sk.aff#L1

andrewshadura commented 3 years ago

Nechápem, ako to myslíš?

zdenop commented 3 years ago

Nastavuje sa balík aspell-sk (2.02-0-6) ...

predpokladam, ze data su aktualne cize 2.05-alpha

andrewshadura commented 3 years ago

Ono to je tak, že v zdrojovom balíku sú dáta z 2.02-0, ale „za jazdy“ sa generuje slovník/affixy z hunspell-sk 2.05 (z libreoffice-dictionaries). Možno by dávalo zmysel vyhodiť všetko okrem metadát a zmeniť verziu.

andrewshadura commented 3 years ago

Ale celkovo si myslím, že pre slovníky schéma verziovania na štýl 2.05 nedáva zmysel; ani semver by sa nehodilo. Najlepšie IMHO je verziovanie podľa dátumu, napr.: 20210210.0.