giellalt / bugzilla-dummy

0 stars 0 forks source link

SME/Voikko-testing gjev feilmelding på čáđa når voikkodata blir lese (Bugzilla Bug 2152) #335

Open albbas opened 8 years ago

albbas commented 8 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2152

Date: 2016-01-21T08:45:44+01:00 From: Sjur Nørstebø Moshagen <> To: Børre Gaup <> CC: sjur.n.moshagen

Last updated: 2018-05-07T09:39:32+02:00

albbas commented 8 years ago

Comment 11117

Date: 2016-01-21 08:45:44 +0100 From: Sjur Nørstebø Moshagen <>

For å gjenta:

1) cd $GTBIG/prooftesting/sme/voikko 2) svn up .. 3) make

Då får eg meldinga:

$ make /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl \ --engine=vk \ --lang=sme \ --input=../all-gs-sme.txt \ --output=goldstandard.spout.txt \ --document=all-gs-sme.txt \ --date=20160120-1503 \ --version="se-4.0-20151217" \ --toolversion="cat sp-version.txt" \ --corpusversion="cat ../corpusrevisions.txt" \ --memoryuse="cat spellermemusage.txt" \ --timeuse="cat spellertimeusage.txt" \ --corrsugg \ --xml=corpus-gs-results.xml Reading typos from ../all-gs-sme.txt /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl: Reading Voikko output from goldstandard.spout.txt Use of uninitialized value in string eq at /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl line 606, line 131026. Use of uninitialized value in concatenation (.) or string at /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl line 607, line 131026.

These suggestions do not seem to belong here Current orig: čáđa: Index: 99323 Original word at this index: Suggestions: čađa cára cába c-áđa čađat

Data som krevst for å få fram feilen blir sjekka inn snart.

albbas commented 8 years ago

Comment 11118

Date: 2016-01-21 08:51:00 +0100 From: Sjur Nørstebø Moshagen <>

Gjentakingsdata sjekka inn i r3413 ($GTBIG).

albbas commented 8 years ago

Comment 11122

Date: 2016-01-23 18:15:54 +0100 From: Børre Gaup <>

Linje 7809-47 i filene ../all-gs-sme.txt og goldstandard.spin.txt begynner med #. Disse filene er på 99331 linjer.

Disse linjene ble sendt inn i spelleren og lager output.

Når man leser inn ../all-gs-sme.txt inn i arrayet originals i funksjonen read_typos, blir disse linjene fjernet. Lengden på originals blir da 99331 - antallet linjer som starter på #. Deretter blir resultatet fra 99331 input-linjer lest inn i funksjonen read_voikko, og lengden på orig har da blitt 99331. Input og output har da kommet ut av sync.

Dette er forhåpentligvis fikset i langtech r128603, der fjerningen av disse linjene blir flyttet fra read_typos i speller-testres.pl til spell-preprocess.pl. Da jeg kjørte hfst-mso-testen, var input/output i xml-filen synkront.

albbas commented 8 years ago

Comment 11341

Date: 2016-05-30 15:56:24 +0200 From: Børre Gaup <>

Ble denne fikset, eller?

albbas commented 6 years ago

Comment 12753

Date: 2018-05-04 20:26:26 +0200 From: Børre Gaup <>

ping

albbas commented 6 years ago

Comment 12781

Date: 2018-05-07 09:39:32 +0200 From: Sjur Nørstebø Moshagen <>

Med dei instruksjonane for reproduksjon som er ført opp her, så er eg ikkje i stand til å reprodusera, så for meg ser det bra ut. Du kan lata att.