legal-nlp / lei-8906

We are applying NLP to http://www.planalto.gov.br/ccivil_03/Leis/L8906.htm
0 stars 2 forks source link

Update art-dd.txt #23

Closed alessandracid closed 6 years ago

arademaker commented 6 years ago

@alessandracid estou aceitando os PRs sem rever detalhes, fiz alguns comentáerios, mas estou aceitando para evitar conflitos de edições nos arquivos.

Idealmente, deveriamos ter feito tudo isto de forma mais planejada. Se tivessemos combinado de forma mais precisa o que queriamos fazer com os textos, por exemplo, revisar anotação efetivamente dos senses ajustando tokenização, poderiamos ter usando o github de forma mais efetiva para revisão de PRs e produzido um corpus anotado.

@vcvpaiva algumas lições que estou aprendendo com estes esforço... estou entendendo que agora vc está começando a criar issues para os arquivos saida do FL. Para cada caso, iremos identificando como ajudar FL e reexecutar resolvendo assim gradativamente os issues. Pode ser um plano.

arademaker commented 6 years ago

@alessandracid, @vcvpaiva e @odanoburu relacionado ao meu comentário anterior aqui, vejam comentários da @alessandracid em https://github.com/own-pt/lei-8906-ownpt/pull/23#discussion_r214890348

O Github oferece várias formas de comunicação: comentários em PR, comentários em issues, comentários específicos sobre linhas de arquivos nos PR etc.

Por isso disse acima que uma lição para mim é que um trabalho como este deve ser bem planejado. Eu acho que nesta altura, seria legal termos um corpus com tokenização, segmentação de sentenças e WSD pelo menos. As anotações neste corpus serviriam de golden para o que esperamos que um sistema faça.