giellalt / bugzilla-dummy

0 stars 0 forks source link

en runde til med valens før spellchecker.cg3 - noen tekniske spørsmål (Bugzilla Bug 2497) #1798

Closed albbas closed 3 years ago

albbas commented 6 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2497

Date: 2018-07-20T13:56:44+02:00 From: Linda Wiechetek <> To: Kevin Brubeck Unhammer <<unhammer+apertium>> CC: linda.wiechetek, sjur.n.moshagen, tommi.pirinen, trond.trosterud

Last updated: 2020-11-16T09:53:21+01:00

albbas commented 6 years ago

Comment 12931

Date: 2018-07-20 13:56:44 +0200 From: Linda Wiechetek <>

Æ jobber med følgende mode:

trace-smegramspell-linda.mode

og har begynt å se på disambiguering av spellchecker forslag.

I følgende setninga:

Ii son leat olmmoš gean don livččet doivun leat mielde Norgga muhtin láhkai eanemus ekstremalaš bellodagas.

er det en feil i ordet "doivun". Etterpå er det en infinitivform. Valens kan brukes for å disambiguere her. Æ foreslår derfor at vi tar en ny runde med valens som bare legger til valenser der det ikkje har skjedd før. Kan vi ta bort duplikater av valens? På denne måten kan vi bruke valens i spellchecker disambiguering.

albbas commented 5 years ago

Comment 13587

Date: 2019-08-20 09:00:32 +0200 From: Sjur Nørstebø Moshagen <>

Det må jo anten skje ved at vi automatisk legg til eit tilleggskrav til valens-reglane om at reglane berre skal slå til på , eller ved at vi for kvar valenstilordning òg legg på ein tagg om at her har vi lagt til valens - då kan vi blokkera valenstilordning i neste runde, og dermed vil det berre skje med forslaga frå stavekontrollen.

Altså:

Alternativ A:

valency.cg3 -> spelled-valency.cg3 (med eit skript som endrar alle SUBSTITUTE-reglane slik:

); -> ) (0 ());

Alternativ B:

Endrar alle SUBSTITUTE-reglane slik (manuelt):

SUBSTITUTE (A) (A ) -> SUBSTITUTE (A) (A )

og deretter:

valency.cg3 -> spelled-valency.cg3 der vi legg til ei line i starten som seier:

PROTECT ();

Synspunkt?

albbas commented 5 years ago

Comment 13679

Date: 2019-09-11 17:13:34 +0200 From: Linda Wiechetek <>

Alternativ A ser enklare ut

albbas commented 4 years ago

Comment 13770

Date: 2019-10-25 08:50:15 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>

Går det an å skriva

PROTECT (*) - ()

for å tagga alt utanom det som har ?

albbas commented 4 years ago

Comment 13771

Date: 2019-10-25 09:08:05 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>

(In reply to Linda Wiechetek from comment #0)

Kan vi ta bort duplikater av valens?

Er valensar nye readings eller nye taggar?

ADD () …

vil jo ikkje legga til viss alt finst.

albbas commented 4 years ago

Comment 13773

Date: 2019-10-25 09:10:18 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>

(In reply to Kevin Brubeck Unhammer from comment #4)

(In reply to Linda Wiechetek from comment #0)

Kan vi ta bort duplikater av valens?

Er valensar nye readings eller nye taggar?

ADD () …

vil jo ikkje legga til viss alt finst.

Nevermind, eg ser valency.cg3 bruker SUBSTITUTE …

Men korfor bruker valency.cg3 SUBSTITUTE i staden for ADD? Burde det ikkje gå an å bruka

ADD () TARGET TH-COM-A (NEGATE 0 Attr LINK NOT 0 PRED-ATTR-ADJ);

i staden for

SUBSTITUTE (A) (A ) TARGET TH-COM-A (NEGATE 0 Attr LINK NOT 0 PRED-ATTR-ADJ);

? Kortare regel, og du slepp duplikat.

albbas commented 4 years ago

Comment 13774

Date: 2019-10-25 09:11:51 +0200 From: Sjur Nørstebø Moshagen <>

(In reply to Kevin Brubeck Unhammer from comment #3)

Går det an å skriva

PROTECT (*) - ()

for å tagga alt utanom det som har ?

Tanken var å tagga alt og berre det som har (), dvs ekskludera alt som ikkje har i seg i dette tilfellet.

På den måten kan vi leggja til valensinfo på forslaga frå stavekontrollen, og berre dei. Det var i alle fall tanken :)

albbas commented 4 years ago

Comment 13775

Date: 2019-10-25 10:13:06 +0200 From: Kevin Brubeck Unhammer <<unhammer+apertium>>

(In reply to Sjur Nørstebø Moshagen from comment #6)

(In reply to Kevin Brubeck Unhammer from comment #3)

Går det an å skriva

PROTECT (*) - ()

for å tagga alt utanom det som har ?

Tanken var å tagga alt og berre det som har (), dvs ekskludera alt som ikkje har i seg i dette tilfellet.

På den måten kan vi leggja til valensinfo på forslaga frå stavekontrollen, og berre dei. Det var i alle fall tanken :)

eh eg meinte «beskytta alt utanom det som har », skreiv litt raskt der. Altså,

SET ikkje-speller = () - (); PROTECT ikkje-speller; ADD () ();

gir

"" "a" ADD:4 "" "b" notspelled PROTECT:3

på input

"" "a" "" "b" notspelled

albbas commented 4 years ago

Comment 13785

Date: 2019-10-30 11:17:56 +0100 From: Linda Wiechetek <>

Ka du meiner med nye lesinger vs. nye tagger, Kevin? Æ har prøvd å finne ut om ADD og SUBSTITUTE no, og er enda ikkje heilt sikker på alle implikasjoner av ADD. I utgangspunktet brukte æ SUBSTITUTE sia æ ikkje ville disambiguere valenstaggan. Dem skulle bare være der for å disambiguere alt anna (sekundærtagger i Eckhard sin terminologi).

Æ prøvde ADD no, og det funker ihvertfall. Kanskje du har rett og ADD er den bedre løsinga. Har lyst å prøve litt først.

(In reply to Kevin Brubeck Unhammer from comment #5)

(In reply to Kevin Brubeck Unhammer from comment #4)

(In reply to Linda Wiechetek from comment #0)

Kan vi ta bort duplikater av valens?

Er valensar nye readings eller nye taggar?

ADD () …

vil jo ikkje legga til viss alt finst.

Nevermind, eg ser valency.cg3 bruker SUBSTITUTE …

Men korfor bruker valency.cg3 SUBSTITUTE i staden for ADD? Burde det ikkje gå an å bruka

ADD () TARGET TH-COM-A (NEGATE 0 Attr LINK NOT 0 PRED-ATTR-ADJ);

i staden for

SUBSTITUTE (A) (A ) TARGET TH-COM-A (NEGATE 0 Attr LINK NOT 0 PRED-ATTR-ADJ);

? Kortare regel, og du slepp duplikat.

albbas commented 4 years ago

Comment 13786

Date: 2019-10-30 11:38:09 +0100 From: Kevin Brubeck Unhammer <<unhammer+apertium>>

(In reply to Linda Wiechetek from comment #8)

Ka du meiner med nye lesinger vs. nye tagger, Kevin?

Eg såg rett etterpå at dei er nye taggar (altså, du har ikkje éin reading per valenstagg)

Æ har prøvd å finne ut om ADD og SUBSTITUTE no, og er enda ikkje heilt sikker på alle implikasjoner av ADD. I utgangspunktet brukte æ SUBSTITUTE sia æ ikkje ville disambiguere valenstaggan. Dem skulle bare være der for å disambiguere alt anna (sekundærtagger i Eckhard sin terminologi).

Æ prøvde ADD no, og det funker ihvertfall. Kanskje du har rett og ADD er den bedre løsinga. Har lyst å prøve litt først.

Ja, eg veit ikkje om alle implikasjonane av å gå over til ADD, men eg trudde iallfall at formålet med ADD var nettopp det du vil ha: å legga til nye taggar på ei lesing, med mindre den taggen er der frå før av.

(Eg trur eldre utgåver av CG berre kunne bruka ADD med @mapping-tags, så det var kanskje nødvendig med SUBSTITUTE før?)

albbas commented 4 years ago

Comment 13787

Date: 2019-10-30 11:55:52 +0100 From: Linda Wiechetek <>

Ja, det var nettopp det æ prøvde, altså om det var nødvendig med prefix (@, %, &) eller ka det måtte være, men det funka fint uten.

(In reply to Kevin Brubeck Unhammer from comment #9)

(In reply to Linda Wiechetek from comment #8)

Ka du meiner med nye lesinger vs. nye tagger, Kevin?

Eg såg rett etterpå at dei er nye taggar (altså, du har ikkje éin reading per valenstagg)

Æ har prøvd å finne ut om ADD og SUBSTITUTE no, og er enda ikkje heilt sikker på alle implikasjoner av ADD. I utgangspunktet brukte æ SUBSTITUTE sia æ ikkje ville disambiguere valenstaggan. Dem skulle bare være der for å disambiguere alt anna (sekundærtagger i Eckhard sin terminologi).

Æ prøvde ADD no, og det funker ihvertfall. Kanskje du har rett og ADD er den bedre løsinga. Har lyst å prøve litt først.

Ja, eg veit ikkje om alle implikasjonane av å gå over til ADD, men eg trudde iallfall at formålet med ADD var nettopp det du vil ha: å legga til nye taggar på ei lesing, med mindre den taggen er der frå før av.

(Eg trur eldre utgåver av CG berre kunne bruka ADD med @mapping-tags, så det var kanskje nødvendig med SUBSTITUTE før?)

albbas commented 4 years ago

Comment 13940

Date: 2020-05-04 14:29:53 +0200 From: Linda Wiechetek <>

Nå har jeg behov for å legge til valens igjen. Det er ord som blir retta av stavekontroll det er snakk om. Her er det "fertebehket" som er feilstava og som har infinitiv-valens som da hjelper meg å finne feilen i "diehttit".

Fertebehket diehttit unnimusat nuppi artistta ja lávlaga dahje guktuid artisttaid ja guktuid lávlagiid, ovdalgo oažžubehket beallečuoggá.

Kan vi bestemme oss for kosjn vi skal gjøre det? Nøkkelen er vel skriptet Sjur snakka om som gjør at vi kan bruke valensfila to ganger, en gang før og en gang etter stavekontrol.

albbas commented 4 years ago

Comment 13956

Date: 2020-07-15 13:22:41 +0200 From: Linda Wiechetek <>

(In reply to Linda Wiechetek from comment #0)

Æ jobber med følgende mode:

trace-smegramspell-linda.mode

og har begynt å se på disambiguering av spellchecker forslag.

I følgende setninga:

Ii son leat olmmoš gean don livččet doivun leat mielde Norgga muhtin láhkai eanemus ekstremalaš bellodagas.

er det en feil i ordet "doivun". Etterpå er det en infinitivform. Valens kan brukes for å disambiguere her. Æ foreslår derfor at vi tar en ny runde med valens som bare legger til valenser der det ikkje har skjedd før. Kan vi ta bort duplikater av valens? På denne måten kan vi bruke valens i spellchecker disambiguering.

The mode I am using now is tools/grammarcheckers/modes/trace-smegramrelease-dev.mode

albbas commented 4 years ago

Comment 13957

Date: 2020-07-15 13:32:10 +0200 From: Linda Wiechetek <>

(In reply to Kevin Brubeck Unhammer from comment #7)

(In reply to Sjur Nørstebø Moshagen from comment #6)

(In reply to Kevin Brubeck Unhammer from comment #3)

Går det an å skriva

PROTECT (*) - ()

for å tagga alt utanom det som har ?

Tanken var å tagga alt og berre det som har (), dvs ekskludera alt som ikkje har i seg i dette tilfellet.

På den måten kan vi leggja til valensinfo på forslaga frå stavekontrollen, og berre dei. Det var i alle fall tanken :)

eh eg meinte «beskytta alt utanom det som har », skreiv litt raskt der. Altså,

SET ikkje-speller = () - (); PROTECT ikkje-speller; ADD () ();

gir

"" "a" ADD:4 "" "b" notspelled PROTECT:3

på input

"" "a" "" "b" notspelled

So as for now, we have a tag for the spellchecker suggestions which is

albbas commented 3 years ago

Comment 14130

Date: 2020-11-16 09:53:21 +0100 From: Linda Wiechetek <>

Tommi fiksa det og la det til en runde etter spelleren:

| vislcg3 --trace -g '/Users/lwi001/lang-sme/tools/grammarcheckers/./../../src/cg3/valency-postspell.cg3' \