LR-POR / MorphoBr

Resources for morphological analysis of Portuguese
Apache License 2.0
24 stars 4 forks source link

lemma of feminine words derived from adjectives #78

Open leoalenc opened 3 years ago

leoalenc commented 3 years ago

O lema do substantivo feminino cheia não deveria ser cheia em vez de cheio, como está atualmente?

nouns/nouns-aa.dict:cheia   cheio+N+F+SG
nouns/nouns-aa.dict:cheias  cheio+N+F+PL

Segundo o dicionário Houaiss, esse substantivo é derivado da forma feminina do adjectivo cheio. O lema de uma palavra derivada, porém, não constitui a base do processo derivacional respectivo, mas a forma de citação da palavra. Por exemplo, os lemas de cafezal, cafezeiro e cafezeiral são cafezal, cafezeiro e cafezeiral, respectivamente, em vez de café:

~/MorphoBr$ grep -E "^cafez[ea]" nouns/*.dict adjectives/*.dict
nouns/nouns-aa.dict:cafezada    cafezada+N+F+SG
nouns/nouns-aa.dict:cafezadas   cafezada+N+F+PL
nouns/nouns-aa.dict:cafezais    cafezal+N+M+PL
nouns/nouns-aa.dict:cafezal cafezal+N+M+SG
nouns/nouns-aa.dict:cafezeira   cafezeiro+N+F+SG
nouns/nouns-aa.dict:cafezeirais cafezeiral+N+M+PL
nouns/nouns-aa.dict:cafezeiral  cafezeiral+N+M+SG
nouns/nouns-aa.dict:cafezeiras  cafezeiro+N+F+PL
nouns/nouns-aa.dict:cafezeiro   cafezeiro+N+M+SG
nouns/nouns-aa.dict:cafezeiros  cafezeiro+N+M+PL
adjectives/adjectives-aa.dict:cafezeira cafezeiro+A+F+SG
adjectives/adjectives-aa.dict:cafezeiras    cafezeiro+A+F+PL
adjectives/adjectives-aa.dict:cafezeiro cafezeiro+A+M+SG
adjectives/adjectives-aa.dict:cafezeiros    cafezeiro+A+M+PL

Por outro lado, a transformação de um substantivo masculino em feminino (ou o inverso), com alteração de significado não relacionada ao gênero é um processo derivacional, como evidenciam estes exemplos:

~/MorphoBr$ grep -E "[[:space:]]+jarr[oa]\+N\+[FM]" nouns/*.dict
nouns/nouns-ac.dict:jarra   jarra+N+F+SG
nouns/nouns-ac.dict:jarras  jarra+N+F+PL
nouns/nouns-ac.dict:jarro   jarro+N+M+SG
nouns/nouns-ac.dict:jarros  jarro+N+M+PL
~/MorphoBr$ grep -E "[[:space:]]+barc[oa]\+N\+[FM]" nouns/*.dict
nouns/nouns-aa.dict:barca   barca+N+F+SG
nouns/nouns-aa.dict:barcas  barca+N+F+PL
nouns/nouns-aa.dict:barco   barco+N+M+SG
nouns/nouns-aa.dict:barcos  barco+N+M+PL

Como se constata nos exemplos, no caso dos substantivos pluralizáveis, o lema é a forma do singular. No caso dos adjetivos, o lema é a forma de masculino singular. Portanto, o lema do substantivo cheia deveria ser cheia. Aparentemente, existem 11116 formas análogas com erro análogo de lematização:

~/MorphoBr$ grep -E "^[^[:space:]]+as?[[:space:]]+[^[:space:]]+o\+N\+F" nouns/*.dict | wc -l
11116
grep -E "^[^[:space:]]+as?[[:space:]]+[^[:space:]]+o\+N\+F" nouns/*.dict | tail
nouns/nouns-ae.dict:óptica  óptico+N+F+SG
nouns/nouns-ae.dict:ópticas óptico+N+F+PL
nouns/nouns-ae.dict:ôntica  ôntico+N+F+SG
nouns/nouns-ae.dict:ônticas ôntico+N+F+PL
nouns/nouns-ae.dict:última  último+N+F+SG
nouns/nouns-ae.dict:últimas último+N+F+PL
nouns/nouns-ae.dict:úmbria  úmbrio+N+F+SG
nouns/nouns-ae.dict:úmbrias úmbrio+N+F+PL
nouns/nouns-ae.dict:única   único+N+F+SG
nouns/nouns-ae.dict:únicas  único+N+F+PL

Curiosamente, a forma ótica, preferida no PB, é lematizada corretamente, diferentemente de óptica, típica do PE:

nouns/nouns-ae.dict:ótica   ótica+N+F+SG
nouns/nouns-ae.dict:óticas  ótica+N+F+PL

Essas incongruências teriam de ser eliminadas. O que acham @vcvpaiva e @arademaker ?

arademaker commented 3 years ago

Este issue trata de forma mais genérica o caso que acabei de fechar #57 . Lá o ultimo comentário do @leoalenc já chama atenção para a necessidade deste issue aqui mais genérico:

É uma questão de coerência. É preciso ter em conta que substantivos diferem de adjetivos quanto à questão do gênero gramatical: os primeiros têm gênero inerente, os segundos, gênero variável. Essa distinção até foi levada em conta pelo Ranta no GF, onde adjetivos do italiano, que apresentam comportamento semelhante aos do português, são representados como tabelas Gender=>Number=>Str. Desse modo, se, seguindo esses três dicionários, admitimos um substantivo última feminino, o lema precisa ser última e não último, pois não existe, por definição, variação (flexão) de gênero em substantivos. A variação que encontramos em casos como último/última é um epifenômeno. Eu acho que já tivemos uma discussão sobre essa questão mais atrás. Interessante verificar como nosso recurso está tratando palavras como aluna e menina. No dicionário Houaiss, a primeira palavra não consta, apenas o masculino, enquanto a segunda tem verbete próprio, dada a semântica especial, inexistente na primeira (além do sexo do referente).

Sobre menina e aluna eu não entendi qual a proposta de @leoalenc, temos atualmente:

nouns/nouns-ac.dict
24186menina menino+N+F+SG
24192meninas    menino+N+F+PL

adjectives/adjectives-ad.dict
4206 menina menino+A+F+SG
4207 meninas    menino+A+F+PL

nouns/nouns-aa.dict
8790 aluna  aluno+N+F+SG
8795 alunas aluno+N+F+PL
arademaker commented 3 years ago

Se entendi corretamente, as entradas para as formas chei[ao]s? agora são:

nouns/nouns-aa.dict
42470cheia  cheia+N+F+SG
42471cheias cheia+N+F+PL
42478cheio  cheio+N+M+SG
42479cheios cheio+N+M+PL

adjectives/adjectives-aa.dict
48752cheia  cheio+A+F+SG
48753cheias cheio+A+F+PL
48762cheio  cheio+A+M+SG
48763cheios cheio+A+M+PL

E o suporte vem de:

  1. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheio (adj e noun masc)
  2. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheia (noun fem)
arademaker commented 3 years ago

commit 6a0c91d não fecha este issue, apenas estou tentando validar meu entendimento para futuras ações.

leoalenc commented 3 years ago

Se entendi corretamente, as entradas para as formas chei[ao]s? agora são:

nouns/nouns-aa.dict
42470cheia    cheia+N+F+SG
42471cheias   cheia+N+F+PL
42478cheio    cheio+N+M+SG
42479cheios   cheio+N+M+PL

adjectives/adjectives-aa.dict
48752cheia    cheio+A+F+SG
48753cheias   cheio+A+F+PL
48762cheio    cheio+A+M+SG
48763cheios   cheio+A+M+PL

E o suporte vem de:

  1. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheio (adj e noun masc)
  2. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheia (noun fem)

@arademaker , correto, ver também:

https://www.aulete.com.br/cheio https://www.aulete.com.br/cheia

leoalenc commented 3 years ago

Este issue trata de forma mais genérica o caso que acabei de fechar #57 . Lá o ultimo comentário do @leoalenc já chama atenção para a necessidade deste issue aqui mais genérico:

É uma questão de coerência. É preciso ter em conta que substantivos diferem de adjetivos quanto à questão do gênero gramatical: os primeiros têm gênero inerente, os segundos, gênero variável.

Sobre menina e aluna eu não entendi qual a proposta de @leoalenc, temos atualmente:

nouns/nouns-ac.dict
24186menina   menino+N+F+SG
24192meninas  menino+N+F+PL

adjectives/adjectives-ad.dict
4206 menina   menino+A+F+SG
4207 meninas  menino+A+F+PL

nouns/nouns-aa.dict
8790 aluna    aluno+N+F+SG
8795 alunas   aluno+N+F+PL

@arademaker , creio que devamos abrir issue sobre isso, para amadurecer uma solução que atenda o uso principal que se quer dar ao recurso. Na teoria gramatical, normalmente o gênero do substantivo é inerente, inexistindo flexão de gênero, contrariamente ao que preconiza a gramática tradicional. Entendo o lema como chave para a entrada de dicionário. Quando a forma feminina é composicional, ou seja, apenas indica "o feminino de X", onde X é o lema da forma masculina, como no caso dealuno e aluna (não tem verbete próprio no Aulete), então teríamos:

aluna aluno+N+F+SG alunas aluno+N+F+PL

Esse não é o caso de menina, com verbete próprio no Aulete, no Porto, Houaiss etc., pois não é mero feminino de menino. Sugiro comparar os dois verbetes nos dicionários mencionados. Mas como vamos saber isso automaticamente?