UniversalDependencies / UD_Portuguese-Bosque

This Universal Dependencies (UD) Portuguese treebank.
Other
50 stars 12 forks source link

Issue 101 #397

Closed wellington36 closed 2 years ago

wellington36 commented 2 years ago

Relacionado aos issue #101 e #136, correções dos seguintes casos:

     34 SUBJ_INDEF
     16 mesoclitic
      1 ​_

do comentário https://github.com/UniversalDependencies/UD_Portuguese-Bosque/issues/101#issuecomment-998707060

arademaker commented 2 years ago

Pode documentar como vc fez as correções ? Foi com script ou edição manual? Se com script peço colocar o script no diretório scripts como parte do PR. Mesmo que tenha sido um bash (she'll) script

arademaker commented 2 years ago

Também seria bom documentar como este PR se relaciona aos issues. Ele fecha algum dos issues ?

wellington36 commented 2 years ago

Pode documentar como vc fez as correções ? Foi com script ou edição manual? Se com script peço colocar o script no diretório scripts como parte do PR. Mesmo que tenha sido um bash (she'll) script

Adicionei o script em 88259ef72a0a93ac72dbbf990b8c343d1a2c9089 apesar de ser um bash simples, a única correção feita manualmente foi esse 1 ​_ (que ainda não sei por que não estava sendo considerando como um _ normal) as demais pelo script.

Também seria bom documentar como este PR se relaciona aos issues.

Farei os devidos cometários nos respectivos issues, porém adiantando básicamente estou desfazendo as modificações propostas em ambos os issue mencionados devido (como dito no comentário https://github.com/UniversalDependencies/UD_Portuguese-Bosque/issues/101#issuecomment-998707060) a quebra da estrutura do conllu que afeta negativamente ferramentas de correção e analise, Tais modificações podem ser adicionadas futuramente de forma palpável.

Ele fecha algum dos issues ?

2 issues são afetados diretamente por esse PR que já estávam fechados desfazendo as modificações, não sei qual seria a melhor opção nesse caso, podemos considerar que os casos dos 2 issues (um identificação de mesóclises e outro "se" com deprel expl mas mantém a informação de ser um indeterminador de sujeito) são ambos "redundantes" e mantê-los fechados.

arademaker commented 2 years ago

Fiz correções localmente, considerando que em alguns casos tive que fazer outras alterações nas árvores sintáticas.