LUMII-AILab / LVWordNet

Dati, skripti un biļetes LVWordNet projektam
0 stars 0 forks source link

Konversija, divdabji, marķēšana tēzaurā #57

Open lrituma opened 3 years ago

lrituma commented 3 years ago

Gribēju ielikt "atsperaizšaujamais" karodizņu, ka vārdšķira ir lietvārds, bet tā nav paredzēts verbalizēt, kā arī Lauma mazliet iebilst, ka liek lietvārda vārdšķiru, jo tomēŗ nevar veidot lietvārdiem rakturīgā delināciju galotnes. Pēc izpētes gramatikā tika secināts, ka konversija process, kuram pateikt, kad tas ir galīgs, nav iespējams. Ir vārdi, par kuru piederību jaunajai vārdšķirai vairs nestrīdās, bet tur arī galotnes jau iederas deklināciju sistēmā - balts, sviests, vecāks. Pārējie ir diskutabli un tiek vērtēti pēc pētījumiem, nosakot, vai vēl lieto iepriekšējās vārdšķiras funkcijā, cik bieži, vai nav palikušas tikai senas liecības. Šādi pētījumi ir laikietilpīgi, nav perdzēts šobrīd Tēzaura komandai, kā arī kritēriji nebūs viennozīmīgi. Šobrīd sanāk, ka vārdi, kas nevar būt darbība vārdi, jo ir veidojušie no vārdkopas, nav pretī atbilstoša darbības vārda, - jaundzimušais, atpakaļejošais utt. - tiek marķēti kā īpašība vārdi ar noteikto galotni, tiek piešķirta īpašība vārda vārdšķira. Un ja uzskata, ka lieto kā lietvārdu, tad liek konversiju , ko verbalizēt kā " lietvārda nozīmē". tad, ja divdabim ir gan īpašības vārda nozīme, gan arī lietvārda nozīme, tad tas ir labs risinājums. Kā marķējot nepazaudēt info par to, ka tas ir tomēr divdabis? Sāda veida karodziņš pie īpašības vārda ir mulsinošs, bet var likt, jādomā, kā verbalizēt. Kā varētu pateikt, ka paradgima ir kā īpašības vārdam, bet statusu atstāt divdabis? Vārdi var atšķirties arī par noteiktību - citus vēl lieto reizēm ar nenoteikto galotni, citus tikai ar noteikto. Mēs ar Laumu domājam, ka konversija varētu palikt kā galvenais karodziņš, kas parāda, ka process ar šo vārdu notiek vai ir noticis. Ja sajūta, ka kāds vārds ir ļoti tuvu procesa galam, par ko liecina tas, ka vārda visas nozīmes lietotas tikai jaunās vārdšķiras funkcijā un nav iespējams atrast piemērus par citu lietojumu, tad to noteikti liek kā atsevišķi šķirkli. Problemātiski ir divdabji, kuri vārdnīcā reizēm ielikti tikai tāpēc, ka kāda no nozīmēm bijusi tieši īpašības vārda funkcijā, bet tas nenozīmē, ka netiek lietots arī kā divdabis. Tiem paliktu karodziņš par konversiju pie noteiktās nozīmes (nevis pie leksēmas), jo pie leksēmas mēs liktu tikai tiem, kuriem vairs nav verbāls lietojums.

lrituma commented 3 years ago

Pēc LV akadēmiskās gramatikas, salikteņus, kuriem otrais komponents no diviem patstāvīgiem vārdiem ir divdabis, pieņemts tomēr uzskatīt par īpašības vārda paradimai piederošiem, uzskatot, ka šajā salikteņa veidošanās procesā notikusi arī adjektivēšanās. Ja tam sekojam, vārdšķira ir īpašības vārds, 43.paradigmā jau ir iekļauta, bet divdabju paradigmām jāliek klāt kā karodziņš, lai tas būtu spēkā pāri no paradigmas mantotajai vārdšķirai.

lrituma commented 3 years ago

Ir vairāki diezgan darbietipīgi ierosinājumi, ko var darīt: 1) izveidot tomēŗ atsevišķu vārdšķiru "Divdabis". teorijā tā mēdz darīt,lv tradīcijā nav pieņemts. ieguvumi - var beigt mēģināt pa visu varu noteikt, vai ir jau īpašības vārds, vai nē, saukt to par divdabju paradigmām un miers. Tikai norādīt konversiju, ka lieto īpašības vārda vai lietvārda nozīmē. Mīnuss - kā paturēt saikni ar verbu, no kura veidots? Kā tagot korpusā un kā likt lemmas? Kā cilvēks atradīs visus nonoteikta verba veidotus divdabjus? Ja šo vārdšķiru taisās lietot tikai specifiskiem divdabju gadījumiem, tas nav konsekventi attiecibā pret morfoloģiju. Vai var ieviest šādu vārdšķiru tikai daļai divdabju speciāli Tēzaura vajadzībām? Vai tas nejauks lasītājam galvu? 2) ierosinājums daļēju konversiju, kad dažreiz lieto īpašības vārda nozīmē, likt pie verba ar ierobežojumu divdabja formā un konversijas karodziņu. Atsevišķus šķirkļus veidot tikai tad, ja konversija pilnībā pabeigta un divdabim vairs nelieto pārējās verba formas (būs tādi, kuram kādu reti vēl lieto, gandrīz nelieto). Ieguvums - konsekventāka pieeja pret to, kā attēlojam, ka kādu no vārda formām lieto citas vārdšķiras nozīmē. Mīnuss - ļoti sarežģās cilvēkam iespēja trast divdabja skaidrojumu - never pa taisno vaļā šķirkli, parādīsies vispirms kā fārda forma no šķirkļa x, un , atverot šķirkli, vārda formas nozīmi jāspēj atrast starp citām verba nozīmēm, tātad daudz neuzskatāmāk.

lauma commented 3 years ago

Ideja par divdabja vārdšķiru nāk no manis un tas, ko es patiesībā ierosināju, bija aliass, ko lietot gadījumos, kad leksēma ir kādā no īpašības vārda vai divdabja paradigmām ielikta - adj-1, adj-2, adjdef-f1, adjdef-f2, adjdef-m, part-1, part-2 - tas aiztaupīs lasītājam un arī vārdnīcas rediģētājam mulsinošo situāciju, kurā viņam citādi sistēma prasītu "Vārdšķira=Darbibas vārds, Formā: Izteiksme=Divdabis" (un varbūt vēl divdabja veidu). Šo mulsinājumu var risināt vai nu sacerot sarežģītu verbalizāciju tikai noteiktas vārdšķiras leksēmām, vai arī var ieviest Vārdšķiras vērtību, kuru Pēteris tālāk iemāca morfoloģijai dekodēt uz to, kas nu morfoloģijas sistēmai iekšā ir vajadzīgs. Tas iet kopā ar to, ka pēc agonizēšanas un putrošanās mēs ar Lauru padevāmies un lūdzām ieviest atsevišķu tēzaura karogu Divdabja veids https://gitlab.com/ailab/tezaurs/-/issues/135, ko morfoloģija tālāk var sev dekodēt uz divdabja kārtu un izteiksmi, bet verbalizēt tēzaura lietotājam mēs tagad varēsim miljonu vienkāršāk.

Un, jā, karogu verbalizācijas vienkāršums diemžēl ir tehnisks, taču svarīgs kritērijs, jo verbalizācija jau ir sarežģīta pēc velna.

lauma commented 3 years ago

Konversijas un šķirļos dalījuma problēma patiesībā ir līdzīga arī īpašības vārdiem pa pakāpēm - mīļš un mīļākais, piemēram, iziet līdzīgu procesu kā ciest un cietušais. Lai vai ko mēs te izlemsim, tas ietekmēs vēlāk arī, ko mēs daram ar tiem.

lrituma commented 3 years ago

Šobrīd rīcība par divdabjiem: 1) pārskatīts mantotais divdabju saraksts (https://docs.google.com/spreadsheets/d/1Llk1N10zTcFuySetrlMBXChOOqTRbzTS/edit#gid=1674331690), kuriem divdabja karodziņi ierobežojumā un kategorija darbības vārds bija salikti automātiski. Tie divdabji, kuri veidojušies no salikteņa un kuriem nav atbilstoša verba, tika marķēti par īpašības vārdiem - paliek spēkā īpašības vārdu un divdabju paradigmas, no kurām automātiski tiek mantota īpašības vārda vārdšķira. Šāda rīcība izvēlēta atbilstoši teorijai Latviešu valodas gramatika (2013) par salikteņkonversiju - norādīts, ka šī procesa rezultātā adjektivizēšanās jau notikusi. 2) divdabji, kuriem ir atblstošs verbs, tika atstāti ar tām pašām īpašības vārdu vai divdabju paradigmām, bet arī karodziņš Vārdšķira: darbības vārds + ierobežojums Formā: Izteiksme: Divdabis IDvdabisxxx. Vārdšķiras karodziņš atceļ no paradigmas mantoto īpašības vārda vārdšķiru.

Vēl daudzi divdabji paslēpušies tai Tēzaura daļā, kas ir apvidvārdi, un kuriem nebija nekādas mantotās gramatikas, pēc kuras noteikt divdabjus. Tos vēl jāskata un jāliek paradigmas nākotnē.

Konversijas plāns, ņemot vērā, ka tas ir process, kurā notiek pakāpeniska pāreja no vienas vārdšķiras uz citu - 1) ja noteiktai vārda formai ir ar nozīmi cieši sasitīta nozīme vai nozīmes nianse, kurai varētu teikt, ka lietots citas vārdšķiras nozīmē, tad to joprojām attēlo vārda šķirklī, norādot noteikto formu un konversijas karodziņu klāt nozīmei. Ja nozīme attālinās un noteikto formu jau bieži izjūt kā citas vārdšķiras nozīmē lietotu formu, to liek kā atsevišķu šķirkli, kur pie leksēmas liek konversijas karodziņu. Mēs neņemamies pētīt un noteikt starpību, ņemam mantojumu, marķējam konsekventi. Liekam atpakaļ pie sākotnējā vārda šķirkļa īpašos gadījumos. Ja konversijas rezultātā divdabis var funkcionēt vienā nozīmē kā īpašības vārds un otrā kā lietvārds, konversijas karodziņu neliek pie leksēmas, bet atsevišķi katrai nozīmei.

lauma commented 3 years ago

Jau rakstīšanas brīdī ir šī biļete https://gitlab.com/ailab/tezaurs/-/issues/135 , vai vajag vēl kaut ko?

lauma commented 3 years ago

Tu tiem labotajiem ņem nost "Neviennozīmīga vārdšķira vai kategorija" karogu?

lrituma commented 2 years ago

Šobrīd (27.01.2022) ir mainījusies situācija par dažiem divdabjiem - tika izveidotas jaunas paradigmas -dams un -damies divdabjiem, kuriem nav atbilstoša verba: 52 - Patstāvīgi divdabji (-dams, -dama) - pusjokodams 53 - Patstāvīgi divdabji (-damies, -damās) - pusjokodamies. Tagad nav skaidrs, ko darīt ar karogu Divdabju veids šādā gadījumā: 1) likt Ierobežojumos kā visiem citiem divdabjiem 2) vai likt šo karogu pa tiešo pie leksēmas darba versijā 3) vai likt mantotu karogu pie paradigmas.

Šajā sakarā ar Laumu diskusija, vai nevarēja pāriet uz karoga Divdabja veids lietošanu pie VISĀM DIVDABJU LEKSĒMĀM, nevis ierobežojumos. Nepieciešama diskusija ar @PeterisP .

lauma commented 2 years ago

Part-1, 2, 3, 4 paradigmām prasītos divdabja tipu mantot no paradigmas. Vai var mantot ierobežojumu? Man šķiet, mantot karogu būtu tehniski daudz vienkāršāk, jo par ierobežojumiem nav skaidrs, kā pateikt, ka mantotais ierobežojums vairs nav spēkā.

Mums kādreiz (2020. gada novembra beigās) bija piedāvājums divdabiskajām leksēmām likt "Vārdšķira: Divdabis" un "Divdabja veids: xxx" kā karogus (pie nozīmēm atstāt kā ierobežojumus), lai tēzaurā būtu vieglāk verbalizēt un marķēt. Tas nozīmētu morfolibā importējot, konvertēt, bet Pēteris vismaz konceptuāli neiebilda, ja nu tēzauram ļoti vajag. Bet acīmredzot tas netika tobrīd ieviests.