LUMII-AILab / LVWordNet

Dati, skripti un biļetes LVWordNet projektam
0 stars 0 forks source link

Paradigmas pie nozīmēm #10

Open lauma opened 4 years ago

lauma commented 4 years ago

Kad būs redaktors, viens no svarīgiem darbiem ir atkauties no paradigmām, kas nokļuvušas pie nozīmēm, nevis leksēmām. Biļetes pieteikšanas brīdī to ir apmēram 675, sadalījums pa paradigmām ir šāds:

234 "["0"]"
140 "["21"]"
137 "["36"]"
57  "["25"]"
42  "["27"]"
38  "["39"]"
21  "["38"]"
2   "["49"]"
1   "["0", "39"]"
1   "["12"]"
1   "["26"]"
1   "["28"]"

Labošanas varianti:

lauma commented 4 years ago

Daļa no nullēm ir problēma transformātorā, kas izsecina paradigmas. Turpmāka informācija sekos.

lauma commented 4 years ago

Izlabojot vienu transformatora kļūdu, gadījuu skaits samazinājās, tagad ir 443 vietas, kur gramatikas teksts rada paradigmu pie vārdšķiras. Uzskaitījums pielikumā.

"["21"]" 140 "["36"]" 137 "["25"]" 57 "["27"]" 42 "["39"]" 39 "["38"]" 21 "["49"]" 2 "["0"]" 2 "["26"]" 1 "["12"]" 1 "["28"]" 1

scratch-tezaurs-paradigmas-pie-sense-3.txt

lauma commented 4 years ago

Pierakstāks laikam ir excelis - uztaisīju, sk. pielikumā. paradigmas+noziimes.xlsx

Un atgādne par paradigmu skaitlīšu nozīmēm ir te https://docs.google.com/spreadsheets/d/1_ToTnhMwdvgzNVWnXLXg77nM-Gq6pj6c_yxAnSxIOnU/edit?usp=sharing

VaBaiba commented 4 years ago

Pa diagonāli pārskatīju problēmu sarakstu, dažus no tiem, bet tiešām nedaudz, es iesūtīšu Sp. kā labojumus, jo tur ir gļuki. Par pārējo lielos vilcienos izkristalizējās:

  1. grupa - tādi, kur pie īpašības vārdiem ir viena apstākļa vārda nozīme (vai pat apakšnozīme, kā "neapmierinoši"). Varbūt ir vērts apstākļa nozīmi pārlikt kā normālu nozīmi pie apstākļa šķirkļa, nevis pliku saiti uz īpašības vārdu, no kura cēlies tas apstāklis. Bet tad tur atkal jāskatās, vai pie apst. šķirkļa ir gan saite, gan arī tā īpašā nozīme. Līdzīgi ir ar divdabjiem un apst. v.
  2. grupa - tādi, kur, manuprāt, būtu jātaisa divi atsevišķi šķirkļi, piem., inkognito un daudzie saīsinājumi.
  3. grupa - saikļi un vietniekvārdi, kam pie nozīmēm ir pieķibināts konkrēts paveids. Nu tā ir vieta, kur var domāt par atstāšanu vienkopus.
  4. grupa - fui, pē, kur mijas gramatika (vārdšķira) ar apv. nozīmi. Nu tur kaut kas jāšķetina un jāšķeterē par jaunu :)
  5. grupa - gan jau ir arī tāda

Blondie jautājumi Laumai: 1) laikam nav variants, ka pie šķirkļa vārda nav nekādas gramatikas, bet pie nozīmēm ir? 2) svešvārda cilme ir ok gramatika, ja? Tā mēs tur beigās sarunājām? BS

svētd., 2020. g. 17. maijs, plkst. 14:02 — lietotājs Lauma (< notifications@github.com>) rakstīja:

Assigned #10 https://github.com/LUMII-AILab/LVWordNet/issues/10 to @VaBaiba https://github.com/VaBaiba.

— You are receiving this because you were assigned. Reply to this email directly, view it on GitHub https://github.com/LUMII-AILab/LVWordNet/issues/10#event-3344427969, or unsubscribe https://github.com/notifications/unsubscribe-auth/ACUPQJBWAIIQQPF6XYNS3M3RR674BANCNFSM4MTTAMDQ .

lrituma commented 4 years ago

Atbilde uz pirmo jautājumu: Mērķis Tēzaurā ir tāds , lai visiem vārdiem pie šķirkļa ir arī gramatiska norāde , kas tā par vārdšķiru, jo tā ir informācija , kuru ņem vērā arī morfoloģiskais tageris. Tas nozīmē, ka jāizskauž gadījumi , kad pie vienas nozīmes pēkšņi ir norāde par piederību pie citas vārdšķiras - tādā gadījumā jāpārliek par atsevišķu šķirkļi - apstākļa vārda gadījumā par citu vārdu , citos gadījumos - par homonīmu. Visiem ļoti grūti šķiramajiem gadījumiem pagaidām tiek izmantoti tie karodziņi - saikļa nozīmē, lietvārda nozīmē, utt. Tāpēc , pat ja šobrīd ir tādi šķirkļi , kuriem pie šķirkļa vārda nav gramatikas nekādas , bet nozīmē ir paradigma , Mēs tos mēģinām izķert - tāpēc arī tapa šis saraksts.

On Tue, 19 May 2020 at 20:10, VaBaiba notifications@github.com wrote:

Pa diagonāli pārskatīju problēmu sarakstu, dažus no tiem, bet tiešām nedaudz, es iesūtīšu Sp. kā labojumus, jo tur ir gļuki. Par pārējo lielos vilcienos izkristalizējās:

  1. grupa - tādi, kur pie īpašības vārdiem ir viena apstākļa vārda nozīme (vai pat apakšnozīme, kā "neapmierinoši"). Varbūt ir vērts apstākļa nozīmi pārlikt kā normālu nozīmi pie apstākļa šķirkļa, nevis pliku saiti uz īpašības vārdu, no kura cēlies tas apstāklis. Bet tad tur atkal jāskatās, vai pie apst. šķirkļa ir gan saite, gan arī tā īpašā nozīme. Līdzīgi ir ar divdabjiem un apst. v.
  2. grupa - tādi, kur, manuprāt, būtu jātaisa divi atsevišķi šķirkļi, piem., inkognito un daudzie saīsinājumi.
  3. grupa - saikļi un vietniekvārdi, kam pie nozīmēm ir pieķibināts konkrēts paveids. Nu tā ir vieta, kur var domāt par atstāšanu vienkopus.
  4. grupa - fui, pē, kur mijas gramatika (vārdšķira) ar apv. nozīmi. Nu tur kaut kas jāšķetina un jāšķeterē par jaunu :)
  5. grupa - gan jau ir arī tāda

Blondie jautājumi Laumai: 1) laikam nav variants, ka pie šķirkļa vārda nav nekādas gramatikas, bet pie nozīmēm ir? 2) svešvārda cilme ir ok gramatika, ja? Tā mēs tur beigās sarunājām? BS

svētd., 2020. g. 17. maijs, plkst. 14:02 — lietotājs Lauma (< notifications@github.com>) rakstīja:

Assigned #10 https://github.com/LUMII-AILab/LVWordNet/issues/10 to @VaBaiba https://github.com/VaBaiba.

— You are receiving this because you were assigned. Reply to this email directly, view it on GitHub https://github.com/LUMII-AILab/LVWordNet/issues/10#event-3344427969, or unsubscribe < https://github.com/notifications/unsubscribe-auth/ACUPQJBWAIIQQPF6XYNS3M3RR674BANCNFSM4MTTAMDQ

.

— You are receiving this because you were assigned.

Reply to this email directly, view it on GitHub https://github.com/LUMII-AILab/LVWordNet/issues/10#issuecomment-630956727, or unsubscribe https://github.com/notifications/unsubscribe-auth/AAPX6DF7F335JNMTWIV7VP3RSK4QPANCNFSM4MTTAMDQ .

lauma commented 4 years ago

Par otro jautājumu neesmu droša, vai pareizi sapratu, bet "vārds svešvalodā", "priedēklis" un "salikteņa daļa" ir pilnvērtīgas "vārdšķiras" saprogrammētajā sistēmā, viņiem vairs nepienākas klasiskās vārdšķiras kā apstākļa vārds, lietvārds, utt.

lauma commented 4 years ago

Precizējums @lrituma teiktajam: mūsu sistēma saprot, ko nozīmē, kad vārdšķira un paradigma ir leksēmai. Leksēmas šķirkļa ietvaros mēdz būt vairākas, arī atvasinājumi, rakstības varianti, manis izkasītie vienskaitļi un vēl nez kas. Vārdšķira/paradigma, kas atrodas pie leksēmas, nav automātiski pārceļama pie leksēmas, it īpaši, ja tās ir vairākas.

VaBaiba commented 4 years ago

Viss skaidrs. Pirmais gan bija jā/nē jautājums.

On Wed, 20 May 2020 at 14:09, Lauma notifications@github.com wrote:

Precizējums @lrituma https://github.com/lrituma teiktajam: mūsu sistēma saprot, ko nozīmē, kad vārdšķira un paradigma ir leksēmai. Leksēmas šķirkļa ietvaros mēdz būt vairākas, arī atvasinājumi, rakstības varianti un vēl nez kas. Vārdšķira/paradigma, kas atrodas pie leksēmas, nav automātiski pārceļama pie leksēmas, it īpaši, ja tās ir vairākas.

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/LUMII-AILab/LVWordNet/issues/10#issuecomment-631407889, or unsubscribe https://github.com/notifications/unsubscribe-auth/ACUPQJAAOS5G5UZQGMP7G6DRSO26VANCNFSM4MTTAMDQ .

VaBaiba commented 4 years ago

Šos mēs ar Sp. salabojām: "["49"]" 2 "["0"]" 2 "["26"]" 1 "["12"]" 1