UniversalDependencies / UD_Portuguese-Bosque

This Universal Dependencies (UD) Portuguese treebank.
Other
48 stars 11 forks source link

DET followed by NOUN, but not related #345

Open wellington36 opened 2 years ago

wellington36 commented 2 years ago

Temos diversos casos da estrutura DET NOUN que não se relacionam, apresentados na query grew.

Dentre os casos temos CF941-2, onde o tem relação det com ano em vez de aumento:

Está em estudo no Ministério da Previdência um conjunto de medidas para desestimular o aumento de aposentadorias no próximo ano.

(edit atualização do link)

arademaker commented 2 years ago

Já em um dos exemplos, aparece novamente um caso relacionado ao #13 e #72, todas as delegações do país onde a analise tratava todas as como uma expressão FIXED. Neste caso, acho melhor todas e as serem determinantes de delegações, @leoalenc algum comentário?

arademaker commented 2 years ago

ignorando alguns casos relacionados a MWE, resolvi alguns casos e aproveitei para atualizar o branch DEV, b4e630d21fb12c16304842adee4798046e8848ab. Assim poderemos ter no grew as queries atualizadas.

arademaker commented 2 years ago

ainda temos 258 casos na query

http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=616d9af5283b2

leoalenc commented 2 years ago

Já em um dos exemplos, aparece novamente um caso relacionado ao #13 e #72, todas as delegações do país onde a analise tratava todas as como uma expressão FIXED. Neste caso, acho melhor todas e as serem determinantes de delegações, @leoalenc algum comentário?

@arademaker , não é interessante a análise de todas as como MWE, uma vez que se trata de construção sintática produtiva:

todos estes carros todas aquelas bicicletas todos eles todas elas todos os carros todos as bicicletas ambos os carros ambas as bicicletas

Em gramática gerativa, itens como tod(o)(a)s que ocorrem na perififeria esquerda do NP antes de um determinante têm sido analisados como quantificadores, núcleos de categoria Q que projetam um QP. Até algum tempo atrás, esses itens eram analisados como pré-determinantes. Veja a tese de Gabriel de Ávila Othero, por exemplo, que comenta essas análises.

wellington36 commented 2 years ago

ainda temos 258 casos na query

http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=616d9af5283b2

Note que, a maior parte dos casos é de fixed: http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=61759c2f5e0d7&whether=*%20-[fixed]-%3E%20DET

(Updated query by @wellington36)

arademaker commented 2 years ago

Seguindo documentação de UD sobre DET, quantificares são marcados como DET e olhando anotações do corpus EWT, nenhuma feature adicional foi usada, embora a página de DET diga:

Pronominal numerals (quantifiers) are tagged DET; besides PronType, they also use the NumType feature.

De qq modo, estou ligando este issue ao #385 , dado que os casos restantes aqui parecem tratar de MWE