Open zdenop opened 3 years ago
@andrewshadura: počkám, či nájdeš viac, aby som to nerobil po jednom riadku ;-)
The condition "[^s][ey][lľ]"
does not guarantee that "ľ" can always be stripped.
SFX D ľ liam [^s][ye][ľl] is:dative is:plural
--- sk_affix.dat.orig 2021-02-07 14:55:31.395919429 +0100
+++ sk_affix.dat 2021-02-07 14:56:28.980340792 +0100
@@ -293,7 +293,7 @@
SFX U a iach [^ďťňľi]a is:locative is:plural
SFX U a ami a is:instrumental is:plural
-SFX D Y 201
+SFX D Y 197
SFX D ec ce ec is:genitive
SFX D ď de ď is:genitive
SFX D eľ le seľ is:genitive
@@ -384,7 +384,6 @@
SFX D ď diam [^i]aď is:dative is:plural
SFX D ň niam lebeň is:dative is:plural
SFX D ň niam [alou]ň is:dative is:plural
-SFX D ň niam eňa is:dative is:plural
SFX D ň niam čeň is:dative is:plural
SFX D ň niam jeseň is:dative is:plural
SFX D ň niam [^á]leň is:dative is:plural
@@ -406,8 +405,7 @@
SFX D eň ňam priazeň is:dative is:plural
SFX D eň ňam báseň is:dative is:plural
SFX D eň ňam i[ae]reň is:dative is:plural
-SFX D eň ňam ec is:dative is:plural
-SFX D ľ liam [^s][ye][ľl] is:dative is:plural
+SFX D ľ liam [^s][ye]ľ is:dative is:plural
SFX D el liam sel is:dative is:plural
SFX D eľ liam myseľ is:dative is:plural
SFX D eľ le seľ is:accusative is:plural
@@ -456,7 +454,6 @@
SFX D ď diach [^i]aď is:locative is:plural
SFX D ň niach lebeň is:locative is:plural
SFX D ň niach [alou]ň is:locative is:plural
-SFX D ň niach eňa is:locative is:plural
SFX D ň niach čeň is:locative is:plural
SFX D ň niach jeseň is:locative is:plural
SFX D ň niach [^á]leň is:locative is:plural
@@ -478,8 +475,7 @@
SFX D eň ňach priazeň is:locative is:plural
SFX D eň ňach báseň is:locative is:plural
SFX D eň ňach i[ae]reň is:locative is:plural
-SFX D eň ňach ec is:locative is:plural
-SFX D ľ liach [^s][ye][ľl] is:locative is:plural
+SFX D ľ liach [^s][ye]ľ is:locative is:plural
SFX D el liach sel is:locative is:plural
SFX D eľ liach myseľ is:locative is:plural
SFX D ec ciach ec is:locative is:plural
s týmito zmenami už je možné spraviť aspell slovník?
Áno, idem to teraz dať do Debianu (experimental). Žiaľ, aspell nepoužívam, tak neviem to poriadne skontrolovať (cc @pali znova 🙂) Ak by to dobre fungovalo, tak dám rovno to unstable 🙂
aspell stále používam, ak bude k dispozícii deb/dsc balík tak ho na debiane otestujem. o pár dní bude freeze balíkov debiane, tak by bolo dobré ho stihnúť zaradiť.
Keď sa zbuilduje, môžeš to rovno aj apt install
:slightly_smiling_face:
Balík sa nainštaloval ale vypisuje warning pri inštalácii:
(Číta sa databáza ... momentálne je nainštalovaných 463726 súborov alebo adresárov.
Preparing to unpack .../aspell-sk_2.02-0-6_all.deb ...
Unpacking aspell-sk (2.02-0-6) over (2.02-0-1.1) ...
Nastavuje sa balík aspell-sk (2.02-0-6) ...
Processing triggers for dictionaries-common (1.28.1) ...
aspell-autobuildhash: processing: sk [sk].
Upozornenie: The word "nie sú" is invalid. Znak ' ' (U+20) sa nesmie vyskytovať uprostred slova. Preskakujem slovo.
Dal som ho spustiť na rôzne texty čo som písal a vyzerá, že funguje všetko ako má.
Hmm, zvláštne je to, keď to zbuildujem lokálne, nevidím tento problém.
Aha, LC_ALL=C
pomohlo.
Ok, bol to problém v skripte, ktorý robil konverziu.
Už to nevypisuje warning pri inštalácii:
(Číta sa databáza ... momentálne je nainštalovaných 463726 súborov alebo adresárov.
Preparing to unpack .../aspell-sk_2.02-0-7_all.deb ...
Unpacking aspell-sk (2.02-0-7) over (2.02-0-6) ...
Nastavuje sa balík aspell-sk (2.02-0-7) ...
Processing triggers for dictionaries-common (1.28.1) ...
aspell-autobuildhash: processing: sk [sk].
verzia 2.02-x-x urcite nie je ok. https://github.com/sk-spell/hunspell-sk/blob/da16fb8c360b3d813b7eec0b8949df1b2a950198/sk_sk.aff#L1
Nechápem, ako to myslíš?
Nastavuje sa balík aspell-sk (2.02-0-6) ...
predpokladam, ze data su aktualne cize 2.05-alpha
Ono to je tak, že v zdrojovom balíku sú dáta z 2.02-0, ale „za jazdy“ sa generuje slovník/affixy z hunspell-sk 2.05 (z libreoffice-dictionaries). Možno by dávalo zmysel vyhodiť všetko okrem metadát a zmeniť verziu.
Ale celkovo si myslím, že pre slovníky schéma verziovania na štýl 2.05 nedáva zmysel; ani semver by sa nehodilo. Najlepšie IMHO je verziovanie podľa dátumu, napr.: 20210210.0.
Aha, to isté tu:
Originally posted by @andrewshadura in https://github.com/sk-spell/hunspell-sk/issues/32#issuecomment-774670691