LUMII-AILab / LVWordNet

Dati, skripti un biļetes LVWordNet projektam
0 stars 0 forks source link

Vai saīsinājumi var būt lokāmi #59

Open lauma opened 3 years ago

lauma commented 3 years ago

Vai tādi saīsinājumi kā k-gs un k-dze ir lokāmi? Ja jā, tad jāizdomā, kā attēlot viņus tēzaurā. Vai tie lokās pēc parastajām lietvārdu paradigmām, piem., pēc 1. un 5. deklinācijas sistēmas?

PeterisP commented 3 years ago

Kādam tagam būtu jābūt pie vārdformas "k-dzei" ? Ja es pieliktu lokāmu k-gs 1. deklinācijas paradigmā, tad viss darbotos, bet tam būtu n..... tags nevis yn kā pašreiz.

Tas ir mazliet tālāk par to, kad mēs savulaik ieviesām saīsinājumu tagu sadalījumu atbilstoši saīsinātajai vārdšķirai.

Konceptuāli visiem lietojumiem kas iet tālāk par morfoloģijas/vārda līmeni - sintakse, semantika, utt - saīsinājums ir ekvivalents saīsinātajai lietai; tādi lietojumi priecātos, ja "k-dzei" būtu ekvivalenti atribūti kā "kundzei", vienīgi ar papildnorādi, ka tas ir saīsinājums; ja "piem." tiktu sintaksē traktēts pilnīgi ekvivalenti kā "piemēram". Tas, šķiet, saskan ar UD pieeju https://universaldependencies.org/u/feat/Abbr.html

Ir tehniska problēma tajā, ka vecajā MULTEXT-EAST stila marķējumā (lemma + pozicionāls tags) nav praktiski norādīt papildu atribūtus. Bet tā ir plašāka sāpe, kas apgrūtina arī citas lietas. Ja mēs ilgtermiņā karodziņu/atribūtu sistēmu ko lieto Tēzaurs un morfoanalizators pamazām izplestu uz citiem rīkiem, iekļaujot to arī korpusu anotācijā, tad varbūt tas būtu ilgtermiņa risinājums, bet nu tas būtu paliels projekts.

lauma commented 3 years ago

Temporāli var ielikt "k-dze" noun-5a paradigmā un pielikt viņai vārdšķiru saīsinājums - no Tēzaura viedokļa var sataisīt smuki, no analizatora viedokļa būs informācija, bet tageris var arī nošauties par tādu perversiju