Closed albbas closed 3 years ago
Date: 2018-07-20 13:56:44 +0200
From: Linda Wiechetek <
Æ jobber med følgende mode:
trace-smegramspell-linda.mode
og har begynt å se på disambiguering av spellchecker forslag.
I følgende setninga:
Ii son leat olmmoš gean don livččet doivun leat mielde Norgga muhtin láhkai eanemus ekstremalaš bellodagas.
er det en feil i ordet "doivun". Etterpå er det en infinitivform. Valens kan brukes for å disambiguere her. Æ foreslår derfor at vi tar en ny runde med valens som bare legger til valenser der det ikkje har skjedd før. Kan vi ta bort duplikater av valens? På denne måten kan vi bruke valens i spellchecker disambiguering.
Date: 2019-08-20 09:00:32 +0200
From: Sjur Nørstebø Moshagen <
Det må jo anten skje ved at vi automatisk legg til eit tilleggskrav til valens-reglane om at reglane berre skal slå til på
Altså:
Alternativ A:
valency.cg3 -> spelled-valency.cg3 (med eit skript som endrar alle SUBSTITUTE-reglane slik:
); -> ) (0 (
Alternativ B:
Endrar alle SUBSTITUTE-reglane slik (manuelt):
SUBSTITUTE (A) (A
og deretter:
valency.cg3 -> spelled-valency.cg3 der vi legg til ei line i starten som seier:
PROTECT (
Synspunkt?
Date: 2019-09-11 17:13:34 +0200
From: Linda Wiechetek <
Alternativ A ser enklare ut
Date: 2019-10-25 08:50:15 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>
Går det an å skriva
PROTECT (*) - (
for å tagga alt utanom det som har
Date: 2019-10-25 09:08:05 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>
(In reply to Linda Wiechetek from comment #0)
Kan vi ta bort duplikater av valens?
Er valensar nye readings eller nye taggar?
ADD (
vil jo ikkje legga til
Date: 2019-10-25 09:10:18 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>
(In reply to Kevin Brubeck Unhammer from comment #4)
(In reply to Linda Wiechetek from comment #0)
Kan vi ta bort duplikater av valens?
Er valensar nye readings eller nye taggar?
ADD (
) … vil jo ikkje legga til
viss alt finst.
Nevermind, eg ser valency.cg3 bruker SUBSTITUTE …
Men korfor bruker valency.cg3 SUBSTITUTE i staden for ADD? Burde det ikkje gå an å bruka
ADD (
i staden for
SUBSTITUTE (A) (A
? Kortare regel, og du slepp duplikat.
Date: 2019-10-25 09:11:51 +0200
From: Sjur Nørstebø Moshagen <
(In reply to Kevin Brubeck Unhammer from comment #3)
Går det an å skriva
PROTECT (*) - (
) for å tagga alt utanom det som har
?
Tanken var å tagga alt og berre det som har (
På den måten kan vi leggja til valensinfo på forslaga frå stavekontrollen, og berre dei. Det var i alle fall tanken :)
Date: 2019-10-25 10:13:06 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>
(In reply to Sjur Nørstebø Moshagen from comment #6)
(In reply to Kevin Brubeck Unhammer from comment #3)
Går det an å skriva
PROTECT (*) - (
) for å tagga alt utanom det som har
? Tanken var å tagga alt og berre det som har (
), dvs ekskludera alt som ikkje har i seg i dette tilfellet. På den måten kan vi leggja til valensinfo på forslaga frå stavekontrollen, og berre dei. Det var i alle fall tanken :)
eh eg meinte «beskytta alt utanom det som har
SET ikkje-speller = () - (
gir
""
"a"
på input
Date: 2019-10-30 11:17:56 +0100
From: Linda Wiechetek <
Ka du meiner med nye lesinger vs. nye tagger, Kevin? Æ har prøvd å finne ut om ADD og SUBSTITUTE no, og er enda ikkje heilt sikker på alle implikasjoner av ADD. I utgangspunktet brukte æ SUBSTITUTE sia æ ikkje ville disambiguere valenstaggan. Dem skulle bare være der for å disambiguere alt anna (sekundærtagger i Eckhard sin terminologi).
Æ prøvde ADD no, og det funker ihvertfall. Kanskje du har rett og ADD er den bedre løsinga. Har lyst å prøve litt først.
(In reply to Kevin Brubeck Unhammer from comment #5)
(In reply to Kevin Brubeck Unhammer from comment #4)
(In reply to Linda Wiechetek from comment #0)
Kan vi ta bort duplikater av valens?
Er valensar nye readings eller nye taggar?
ADD (
) … vil jo ikkje legga til
viss alt finst. Nevermind, eg ser valency.cg3 bruker SUBSTITUTE …
Men korfor bruker valency.cg3 SUBSTITUTE i staden for ADD? Burde det ikkje gå an å bruka
ADD (
) TARGET TH-COM-A (NEGATE 0 Attr LINK NOT 0 PRED-ATTR-ADJ); i staden for
SUBSTITUTE (A) (A
) TARGET TH-COM-A (NEGATE 0 Attr LINK NOT 0 PRED-ATTR-ADJ); ? Kortare regel, og du slepp duplikat.
Date: 2019-10-30 11:38:09 +0100 From: Kevin Brubeck Unhammer <<unhammer+apertium>>
(In reply to Linda Wiechetek from comment #8)
Ka du meiner med nye lesinger vs. nye tagger, Kevin?
Eg såg rett etterpå at dei er nye taggar (altså, du har ikkje éin reading per valenstagg)
Æ har prøvd å finne ut om ADD og SUBSTITUTE no, og er enda ikkje heilt sikker på alle implikasjoner av ADD. I utgangspunktet brukte æ SUBSTITUTE sia æ ikkje ville disambiguere valenstaggan. Dem skulle bare være der for å disambiguere alt anna (sekundærtagger i Eckhard sin terminologi).
Æ prøvde ADD no, og det funker ihvertfall. Kanskje du har rett og ADD er den bedre løsinga. Har lyst å prøve litt først.
Ja, eg veit ikkje om alle implikasjonane av å gå over til ADD, men eg trudde iallfall at formålet med ADD var nettopp det du vil ha: å legga til nye taggar på ei lesing, med mindre den taggen er der frå før av.
(Eg trur eldre utgåver av CG berre kunne bruka ADD med @mapping-tags, så det var kanskje nødvendig med SUBSTITUTE før?)
Date: 2019-10-30 11:55:52 +0100
From: Linda Wiechetek <
Ja, det var nettopp det æ prøvde, altså om det var nødvendig med prefix (@, %, &) eller ka det måtte være, men det funka fint uten.
(In reply to Kevin Brubeck Unhammer from comment #9)
(In reply to Linda Wiechetek from comment #8)
Ka du meiner med nye lesinger vs. nye tagger, Kevin?
Eg såg rett etterpå at dei er nye taggar (altså, du har ikkje éin reading per valenstagg)
Æ har prøvd å finne ut om ADD og SUBSTITUTE no, og er enda ikkje heilt sikker på alle implikasjoner av ADD. I utgangspunktet brukte æ SUBSTITUTE sia æ ikkje ville disambiguere valenstaggan. Dem skulle bare være der for å disambiguere alt anna (sekundærtagger i Eckhard sin terminologi).
Æ prøvde ADD no, og det funker ihvertfall. Kanskje du har rett og ADD er den bedre løsinga. Har lyst å prøve litt først.
Ja, eg veit ikkje om alle implikasjonane av å gå over til ADD, men eg trudde iallfall at formålet med ADD var nettopp det du vil ha: å legga til nye taggar på ei lesing, med mindre den taggen er der frå før av.
(Eg trur eldre utgåver av CG berre kunne bruka ADD med @mapping-tags, så det var kanskje nødvendig med SUBSTITUTE før?)
Date: 2020-05-04 14:29:53 +0200
From: Linda Wiechetek <
Nå har jeg behov for å legge til valens igjen. Det er ord som blir retta av stavekontroll det er snakk om. Her er det "fertebehket" som er feilstava og som har infinitiv-valens som da hjelper meg å finne feilen i "diehttit".
Fertebehket diehttit unnimusat nuppi artistta ja lávlaga dahje guktuid artisttaid ja guktuid lávlagiid, ovdalgo oažžubehket beallečuoggá.
Kan vi bestemme oss for kosjn vi skal gjøre det? Nøkkelen er vel skriptet Sjur snakka om som gjør at vi kan bruke valensfila to ganger, en gang før og en gang etter stavekontrol.
Date: 2020-07-15 13:22:41 +0200
From: Linda Wiechetek <
(In reply to Linda Wiechetek from comment #0)
Æ jobber med følgende mode:
trace-smegramspell-linda.mode
og har begynt å se på disambiguering av spellchecker forslag.
I følgende setninga:
Ii son leat olmmoš gean don livččet doivun leat mielde Norgga muhtin láhkai eanemus ekstremalaš bellodagas.
er det en feil i ordet "doivun". Etterpå er det en infinitivform. Valens kan brukes for å disambiguere her. Æ foreslår derfor at vi tar en ny runde med valens som bare legger til valenser der det ikkje har skjedd før. Kan vi ta bort duplikater av valens? På denne måten kan vi bruke valens i spellchecker disambiguering.
The mode I am using now is tools/grammarcheckers/modes/trace-smegramrelease-dev.mode
Date: 2020-07-15 13:32:10 +0200
From: Linda Wiechetek <
(In reply to Kevin Brubeck Unhammer from comment #7)
(In reply to Sjur Nørstebø Moshagen from comment #6)
(In reply to Kevin Brubeck Unhammer from comment #3)
Går det an å skriva
PROTECT (*) - (
) for å tagga alt utanom det som har
? Tanken var å tagga alt og berre det som har (
), dvs ekskludera alt som ikkje har i seg i dette tilfellet. På den måten kan vi leggja til valensinfo på forslaga frå stavekontrollen, og berre dei. Det var i alle fall tanken :)
eh eg meinte «beskytta alt utanom det som har
», skreiv litt raskt der. Altså, SET ikkje-speller = () - (
); PROTECT ikkje-speller; ADD ( );) ( gir
"" "a"
ADD:4 "" "b" notspelled PROTECT:3 på input
So as for now, we have a tag for the spellchecker suggestions which is
Date: 2020-11-16 09:53:21 +0100
From: Linda Wiechetek <
Tommi fiksa det og la det til en runde etter spelleren:
| vislcg3 --trace -g '/Users/lwi001/lang-sme/tools/grammarcheckers/./../../src/cg3/valency-postspell.cg3' \
This issue was created automatically with bugzilla2github
Bugzilla Bug 2497
Date: 2018-07-20T13:56:44+02:00 From: Linda Wiechetek <>
To: Kevin Brubeck Unhammer <<unhammer+apertium>>
CC: linda.wiechetek, sjur.n.moshagen, tommi.pirinen, trond.trosterud
Last updated: 2020-11-16T09:53:21+01:00