cpdoc / dhbb-nlp

processamentos DHBB
Other
5 stars 2 forks source link

Flat:name para títulos de livros e artigos? #8

Closed suemi-higuchi closed 7 years ago

suemi-higuchi commented 7 years ago

Dúvida: titulos de publicações devem ser juntados? Por exemplo (7.conllu):

14  sob sob ADP _   _   16  case    _   _
15  o   o   DET _   Definite=Def|Gender=Masc|Number=Sing|PronType=Art   16  det _   _
16  título  título  NOUN    _   Gender=Masc|Number=Sing 31  obl _   _
17  *   *   PUNCT   _   _   16  punct   _   SpaceAfter=No
18  Brasil-Irã  Brasil-Irã  PROPN   _   Gender=Fem|Number=Sing  16  appos   _   SpaceAfter=No           
19  :   :   PUNCT   _   _   16  punct   _   _
20  como    como    ADV _   _   18  flat:name   _   _
21  fazer   fazer   VERB    _   VerbForm=Inf    18  flat:name   _   _
22  amigos  amigo   NOUN    _   Gender=Masc|Number=Plur 18  flat:name   _   _
23  e   e   CCONJ   _   _   24  cc  _   _
24-25   dar-se  _   _   _   _   _   _   _   _
24  dar dar VERB    _   VerbForm=Inf    18  flat:name   _   _
25  se  se  PRON    _   Case=Acc|Gender=Masc|Number=Sing|Person=3|PronType=Prs  18  flat:name   _   _
26  mal mal ADV _   _   18  flat:name   _   SpaceAfter=No
27  *   *   PUNCT   _   _   18  flat:name   _   SpaceAfter=No
28  ,   ,   PUNCT   _   _   16  punct   _   _
arademaker commented 7 years ago

@suemi-higuchi vide http://universaldependencies.org/u/dep/flat.html, quando eles falam do exemplo de como anotar 'Lord of the Rings'. Não deve ser tudo flat não. Vou deixar @claudiafreitas comentar mais sobre estas análises, acho que esta análise está ruim.

De qq modo aproveitei para corrigir outros detalhes no d6d49762.

claudiafreitas commented 7 years ago

títulos e publicações, pelo UD, devem receber análise sintática convencional. Mas, do ponto de vista de entidades mencionadas, do poto de vista da INFORMAÇÃO, são sim uma unidade. Como articular os dois níveis de informação na Anotação? lembro que, nos léxicos da Suemi, há muitas coisas que são uma unidade mas que, pelo UD, precisam de uma análise sintática convencional...

claudiafreitas commented 7 years ago

@suemi-higuchi , para não perdermos a informação de que essas coisas são uma unidade de informação, deixaremos indicado NE no campo MISC, ok?

GPPassos commented 7 years ago

Essa é a mesma discussão que o issue #7.