cpdoc / dhbb-nlp

processamentos DHBB
Other
5 stars 2 forks source link

mini-dhbb: strange punctuation marks #66

Closed vcvpaiva closed 3 years ago

vcvpaiva commented 3 years ago

«José Eduardo Siqueira Campos» nasceu em Campinas (SP) no dia 4 de março de 1959, filho de José Wilson Siqueira Campos e Aureni Siqueira Campos.

I wonder if the punctuation marks around the first name are useful for something.

arademaker commented 3 years ago

o CPDOC adotava com padrão o uso desta quotation. Mas já estamos revendo isso. @jaquepz está preparando novo guia de edição dos verbetes. De fato, estas quotation marks não fazem sentido, não estão nos teclados atuais, para começar. Mas isso infelizmente não me parece algo para ser revolvido neste repo, mas no repo oficial do DHBB.

Por outro lado, a marcação de alguns nomes como nomes de comissões poderia ajudar um sistema de processamento, dado que temos algumas ambiguidades quanto a demarcação dos nomes.

vcvpaiva commented 3 years ago

Por outro lado, a marcação de alguns nomes como nomes de comissões poderia ajudar um sistema de processamento, dado que temos algumas ambiguidades quanto a demarcação dos nomes.

well, then I expect in the big repo you'd want to do this generic replacement of funny marks by flat expressions and instead of closing that you'd move it to the correct area of the repo.

On Sun, Apr 4, 2021 at 9:26 AM Alexandre Rademaker @.***> wrote:

Closed #66 https://github.com/cpdoc/dhbb-nlp/issues/66.

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/cpdoc/dhbb-nlp/issues/66#event-4549275791, or unsubscribe https://github.com/notifications/unsubscribe-auth/AAIZ3H7VYDKNVD762C4WUITTHCHNBANCNFSM42LQBXEA .

-- Valeria de Paiva http://vcvpaiva.github.io/ http://www.cs.bham.ac.uk/~vdp/