UniversalDependencies / UD_Russian-PUD

Parallel Universal Dependencies.
Other
2 stars 0 forks source link

Inconsistent lemmas for adjectives and participles #3

Closed The-Keeper closed 4 years ago

The-Keeper commented 5 years ago
# sent_id = w01100049
# text = В 1856 году началась Вторая опиумная война; китайцы снова были побеждены и принуждены к заключению Тяньцзиньского договора 1858 года и Пекинской конвенции 1860 года.
# english_text = In 1856, the Second Opium War broke out; the Chinese were again defeated and forced to the terms of the 1858 Treaty of Tientsin and the 1860 Convention of Peking.
1   В   в   ADP IN  _   3   case    _   _
2   1856    1856    ADJ ORD _   3   amod    _   _
3   году    год NOUN    NN  Animacy=Inan|Case=Loc|Gender=Masc|Number=Sing   4   obl _   _
4   началась    начаться    VERB    VBC Aspect=Perf|Gender=Fem|Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin|Voice=Mid   0   root    _   _
5   Вторая  второй  ADJ JJ  Case=Nom|Degree=Pos|Gender=Fem|Number=Sing  7   amod    _   Proper=True
6   опиумная    опиумный    ADJ JJ  Case=Nom|Degree=Pos|Gender=Fem|Number=Sing  7   amod    _   Proper=True
7   война   война   NOUN    NN  Animacy=Inan|Case=Nom|Gender=Fem|Number=Sing    4   nsubj   _   SpaceAfter=No
8   ;   ;   PUNCT   :   _   4   punct   _   _
9   китайцы китаец  NOUN    NN  Animacy=Anim|Case=Nom|Gender=Masc|Number=Plur   12  nsubj:pass  _   _
10  снова   снова   ADV RB  Degree=Pos  12  advmod  _   _
11  были    быть    AUX VBC Aspect=Imp|Mood=Ind|Number=Plur|Tense=Past|VerbForm=Fin|Voice=Act   12  aux:pass    _   _
12  побеждены   побеждать   VERB    VBNH    Aspect=Perf|Number=Plur|Tense=Past|Variant=Short|VerbForm=Part|Voice=Pass   4   parataxis   _   _
13  и   и   CCONJ   CC  _   14  cc  _   _
14  принуждены  принужденный    VERB    VBNH    Aspect=Perf|Number=Plur|Tense=Past|Variant=Short|VerbForm=Part|Voice=Pass   12  conj    _   _
15  к   к   ADP IN  _   16  case    _   _
16  заключению  заключение  NOUN    NN  Animacy=Inan|Case=Dat|Gender=Neut|Number=Sing   14  obl _   _
17  Тяньцзиньского  тяньцзиньский   ADJ JJ  Case=Gen|Degree=Pos|Gender=Masc|Number=Sing 18  amod    _   Proper=True
18  договора    договор NOUN    NN  Animacy=Inan|Case=Gen|Gender=Masc|Number=Sing   16  nmod    _   _
19  1858    1858    ADJ ORD _   20  amod    _   _
20  года    год NOUN    NN  Animacy=Inan|Case=Gen|Gender=Masc|Number=Sing   18  nmod    _   _
21  и   и   CCONJ   CC  _   23  cc  _   _
22  Пекинской   пекинский   ADJ JJ  Case=Gen|Degree=Pos|Gender=Fem|Number=Sing  23  amod    _   Proper=True
23  конвенции   конвенция   NOUN    NN  Animacy=Inan|Case=Gen|Gender=Fem|Number=Sing    18  conj    _   _
24  1860    1860    ADJ ORD _   25  amod    _   _
25  года    год NOUN    NN  Animacy=Inan|Case=Gen|Gender=Masc|Number=Sing   23  nmod    _   SpaceAfter=No
26  .   .   PUNCT   .   _   4   punct   _   _

Here (12) побеждены and (14) принуждены are marked as VERB but the lemma of the first one is a verb (побеждать) and of the second one is an adjective/participle (принужденный). I suppose the lemma of the second one should be a verb as well (принуждать).

# sent_id = w01101046
# text = Первые изобретения Ламарр включают улучшенный светофор и таблетку, которая, растворяясь в воде, делает ее газированной.
# english_text = Lamarr's earliest inventions include an improved traffic stoplight and a tablet that would dissolve in water to create a carbonated drink.
1   Первые  первый  ADJ JJ  Case=Nom|Degree=Pos|Number=Plur 2   amod    _   _
2   изобретения изобретение NOUN    NN  Animacy=Inan|Case=Nom|Gender=Neut|Number=Plur   4   nsubj   _   _
3   Ламарр  Ламарр  PROPN   NNP Animacy=Anim|Case=Gen|Gender=Fem|Number=Sing    2   nmod    _   _
4   включают    включать    VERB    VBC Aspect=Imp|Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act  0   root    _   _
5   улучшенный  улучшить    ADJ JJ  Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc|Number=Sing    6   amod    _   _
6   светофор    светофор    NOUN    NN  Animacy=Inan|Case=Acc|Gender=Masc|Number=Sing   4   obj _   _
7   и   и   CCONJ   CC  _   8   cc  _   _
8   таблетку    таблетка    NOUN    NN  Animacy=Inan|Case=Acc|Gender=Fem|Number=Sing    6   conj    _   SpaceAfter=No
9   ,   ,   PUNCT   ,   _   16  punct   _   _
10  которая который PRON    WDT Case=Nom|Gender=Fem|Number=Sing 16  nsubj   _   SpaceAfter=No
11  ,   ,   PUNCT   ,   _   12  punct   _   _
12  растворяясь растворяться    VERB    VBG Aspect=Imp|Tense=Pres|VerbForm=Conv|Voice=Mid   16  advcl   _   _
13  в   в   ADP IN  _   14  case    _   _
14  воде    вода    NOUN    NN  Animacy=Inan|Case=Loc|Gender=Fem|Number=Sing    12  obl _   SpaceAfter=No
15  ,   ,   PUNCT   ,   _   12  punct   _   _
16  делает  делать  VERB    VBC Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act  8   acl:relcl   _   _
17  ее  она PRON    PRP Case=Acc|Gender=Fem|Number=Sing|Person=3    16  obj _   _
18  газированной    газированный    ADJ JJ  Case=Ins|Degree=Pos|Gender=Fem|Number=Sing  16  xcomp   _   SpaceAfter=No
19  .   .   PUNCT   .   _   4   punct   _   _

Here (5) улучшенный and (18) газированной are marked as ADJ but the lemma of the first one is a verb (улучшить) and of the second one is an adjective/participle (газированный). They both seem to function as adjectives, so my guess is that the lemma of the first one should be an adjective/participle (улучшенный). Well, either that or both of them should have verb lemmas, shouldn't they?

Kira-D commented 4 years ago

I agree with @dan-zeman.

Fixed in 2.6