apertium / apertium-tat

Apertium linguistic data for Tatar
GNU General Public License v3.0
4 stars 3 forks source link

Unrecognized numerals #37

Open IlnarSelimcan opened 5 years ago

IlnarSelimcan commented 5 years ago

! ^алтылап/алтылап$ ! ^алтышар/алтышар$ ! ^бишләп/бишләп$! ^алтылап/алтылап$ ! ^алтышар/алтышар$ ! ^бишләп/бишләп$ ! ^дистәләрчә/дистәләрчә$ ! ^дүртләп/дүртләп$ ! ^җиделәп/җиделәп$ ! ^җидешәр/җидешәр$ ! ^икешәр/икешәр$ ! ^йөзәрләгән/йөзәрләгән$ ! ^йөзләрчә/йөзләрчә$ ! ^меңәрләгән/меңәрләгән$ ! ^меңәрләп/меңәрләп$ ! ^меңләп/меңләп$ ! ^меңнәрчә/меңнәрчә$ ! ^миллиардларча/миллиардларча$ ! ^миллионнарча/миллионнарча$ ! ^өчәрләп/өчәрләп$ ! ^өчләп/өчләп$ ! ^тугызлап/тугызлап$ ! ^тугызлашып/тугызлашып$ ! ^унарлаган/унарлаган$ ! ^унарлап/унарлап$ ! ^унаулап/унаулап$ ! ^унаулап/унаулап$^-/-$^унаулап/унаулап$ ! ^унлап/унлап$ ! ^унлап/унлап$^-/-$^унлап/унлап$ ! ^уннарча/уннарча$

! ^дистәләрчә/дистәләрчә$ ! ^дүртләп/дүртләп$ ! ^җиделәп/җиделәп$ ! ^җидешәр/җидешәр$ ! ^икешәр/икешәр$ ! ^йөзәрләгән/йөзәрләгән$ ! ^йөзләрчә/йөзләрчә$ ! ^меңәрләгән/меңәрләгән$ ! ^меңәрләп/меңәрләп$ ! ^меңләп/меңләп$ ! ^меңнәрчә/меңнәрчә$ ! ^миллиардларча/миллиардларча$ ! ^миллионнарча/миллионнарча$ ! ^өчәрләп/өчәрләп$ ! ^өчләп/өчләп$ ! ^тугызлап/тугызлап$ ! ^тугызлашып/тугызлашып$ ! ^унарлаган/унарлаган$ ! ^унарлап/унарлап$ ! ^унаулап/унаулап$ ! ^унаулап/унаулап$^-/-$^унаулап/унаулап$ ! ^унлап/унлап$ ! ^унлап/унлап$^-/-$^унлап/унлап$ ! ^уннарча/уннарча$ ! ^алтылап/алтылап$ ! ^алтышар/алтышар$ ! ^бишләп/бишләп$ ! ^дистәләрчә/дистәләрчә$ ! ^дүртләп/дүртләп$ ! ^җиделәп/җиделәп$ ! ^җидешәр/җидешәр$ ! ^икешәр/икешәр$ ! ^йөзәрләгән/йөзәрләгән$ ! ^йөзләрчә/йөзләрчә$ ! ^меңәрләгән/меңәрләгән$ ! ^меңәрләп/меңәрләп$ ! ^меңләп/меңләп$ ! ^меңнәрчә/меңнәрчә$ ! ^миллиардларча/миллиардларча$ ! ^миллионнарча/миллионнарча$ ! ^өчәрләп/өчәрләп$ ! ^өчләп/өчләп$ ! ^тугызлап/тугызлап$ ! ^тугызлашып/тугызлашып$ ! ^унарлаган/унарлаган$ ! ^унарлап/унарлап$ ! ^унаулап/унаулап$ ! ^унаулап/унаулап$^-/-$^унаулап/унаулап$ ! ^унлап/унлап$ ! ^унлап/унлап$^-/-$^унлап/унлап$ ! ^уннарча/*уннарча$

These numerals from corpus.tatar currently aren't analysed.

All four (-ләп, -әрләп, -ләгән, -ләрчә) more or less have the same meaning -- approximation. The question is, which tags should they receive. Ideally the choices we make shouldn't surprise someone familiar with academic Tatar grammars.! ^алтылап/алтылап$ ! ^алтышар/алтышар$ ! ^бишләп/бишләп$ ! ^дистәләрчә/дистәләрчә$ ! ^дүртләп/дүртләп$ ! ^җиделәп/җиделәп$ ! ^җидешәр/җидешәр$ ! ^икешәр/икешәр$ ! ^йөзәрләгән/йөзәрләгән$ ! ^йөзләрчә/йөзләрчә$ ! ^меңәрләгән/меңәрләгән$ ! ^меңәрләп/меңәрләп$ ! ^меңләп/меңләп$ ! ^меңнәрчә/меңнәрчә$ ! ^миллиардларча/миллиардларча$ ! ^миллионнарча/миллионнарча$ ! ^өчәрләп/өчәрләп$ ! ^өчләп/өчләп$ ! ^тугызлап/тугызлап$ ! ^тугызлашып/тугызлашып$ ! ^унарлаган/унарлаган$ ! ^унарлап/унарлап$ ! ^унаулап/унаулап$ ! ^унаулап/унаулап$^-/-$^унаулап/унаулап$ ! ^унлап/унлап$ ! ^унлап/унлап$^-/-$^унлап/унлап$ ! ^уннарча/*уннарча$

Once we figure this out, a numerals.tsv file with the above forms should be added to apertium-tat/tests/morphophonology. See other apertium-tat/tests/morphophonology/test.py for details.

IlnarSelimcan commented 5 years ago

Just for reference, see how it works in Kazakh: http://kaz-tili.kz/chislit04.htm

IlnarSelimcan commented 5 years ago

One option is to lexicalise them:

меңләгән:меңләгән NUM-APPRX ;
меңнәрчә:меңнәрчә NUM-APPRX ;