LR-POR / MorphoBr

Resources for morphological analysis of Portuguese
Apache License 2.0
24 stars 4 forks source link

PAST-PART de "assentar" indicando problema do algoritmo de classificação? #111

Closed leoalenc closed 2 years ago

leoalenc commented 2 years ago

@analununes, http://www.portaldalinguaportuguesa.org/index.php?action=lemma&lemma=24481 não apresenta assento para PAST-PART. Na tabela irregs.txt, temos:

assentado PAST-PART-SUFFIX assentar assente PAST-PART-SUFFIX assentar assentado PAST-PART-SUFFIX assentar assento PAST-PART-SUFFIX assentar

Estou estranhando a repetição de assentado. Isso não deveria ocorrer, mesmo se admitirmos que assento é um particípio válido. Problema de desenho do algoritmo?

analununes commented 2 years ago

As entradas assento e assentos foram eliminadas no commit 3fd6813fcfaa473f778d7fd1ce945299ceb5dc44. A questão da duplicação será tratada aqui.

arademaker commented 2 years ago

mas vc não respondeu a pergunta do @leoalenc, era um problema no algoritmo?

analununes commented 2 years ago

mas vc não respondeu a pergunta do @leoalenc , era um problema no algoritmo?

@arademaker, para cada forma, o algoritmo classifica como regular ou irregular e produz a saída correspondente. No caso acima, quando assente foi analisado a saída produzida foi:

assentado PAST-PART-SUFFIX assentar assente PAST-PART-SUFFIX assentar

que corresponde à forma regular e à forma regular e individualmente está certo.

A saída produzida para a forma assento também está individualmente certa, forma regular e forma irregular:

assentado PAST-PART-SUFFIX assentar assento PAST-PART-SUFFIX assentar

O problema é que a entrada regular assentado PAST-PART-SUFFIX assentar deveria ocorrer apenas uma vez na tabela, ou seja, as duas saídas juntas deveriam ser:

assentado PAST-PART-SUFFIX assentar assente PAST-PART-SUFFIX assentar assento PAST-PART-SUFFIX assentar

leoalenc commented 2 years ago

O problema é que a entrada regular assentado PAST-PART-SUFFIX assentar deveria ocorrer apenas uma vez na tabela, ou seja, as duas saídas juntas deveriam ser:

assentado PAST-PART-SUFFIX assentar assente PAST-PART-SUFFIX assentar assento PAST-PART-SUFFIX assentar

@arademaker e @analununes , sim, deveria ser dessa forma.