LR-POR / tools

Tools for checking the compatibility between a lexical resource and a treebank
BSD 3-Clause "New" or "Revised" License
2 stars 0 forks source link

adicionar entradas no MorphoBr #34

Closed analununes closed 2 years ago

analununes commented 2 years ago

Atualmente, para adicionar entradas no MorphoBr, temos apenas uma função que recebe um lema e adiciona as entradas geradas a partir das regras da PorGram. A intenção aqui é implementar uma função que adicione entradas já formadas.

analununes commented 2 years ago

No commit 7cf60b97871c1ea8f31f20549b2b3c6d1b8d3c36, a função addEntries recebe o path de um diretório do MorphoBr e o path de um arquivo contendo as entradas que serão adicionadas. O algoritmo separa as entradas que serão adicionadas em grupos de acordo com o lema e verifica se elas já existem no dicionário, retornando apenas as que ainda não foram incluídas. Para adicionar as entradas foi priorizada a possibilidade de verificar as alterações no diff, o algoritmo passa pelas entradas do MorphoBr conferindo se o lema analisado é igual ao lema de um grupo de entradas que serão adicionadas, em caso positivo esse grupo é adicionado antes da entrada analisada. Por exemplo:

As entradas

aspersa aspergir+V+PTPST+F+SG
aspersas    aspergir+V+PTPST+F+PL
asperso aspergir+V+PTPST+M+SG
aspersos    aspergir+V+PTPST+M+PL

são adicionadas no arquivo verbs-a.dict na seguinte posição:

asperjas    asperger+V+SBJR+2+SG
asperjo asperger+V+PRS+1+SG
aspersa aspergir+V+PTPST+F+SG
aspersas    aspergir+V+PTPST+F+PL
asperso aspergir+V+PTPST+M+SG
aspersos    aspergir+V+PTPST+M+PL
asperge aspergir+V+PRS+3+SG
asperge aspergir+V+IMP+2+SG

https://github.com/LR-POR/MorphoBr/commit/c258af2946a644acb947793a51d84d49a80d0f10

analununes commented 2 years ago

No commit 9d67c5bf112147782bab9f53927f8013370be9cd a função foi adaptada para o caso em que o lema da entrada que está sendo adicionada ainda não foi incluído no MorphoBr.