ipeaGIT / enderecopadrao

Pacote de R para padronizar endereços brasileiros
https://ipeagit.github.io/enderecopadrao/
Other
0 stars 0 forks source link

padronizador para complemento #1

Closed lucasmation closed 3 months ago

lucasmation commented 4 months ago

Um aspecto importante é padronizar os complementos. Por exmeplko CASA CS, APTP ap AP, etc.... harmonizar espaços, etc.

lucasmation commented 4 months ago

@dhersz, por favor foca neste issue

dhersz commented 4 months ago

Não tenho acesso a nenhuma base com um campo de complemento a parte por enquanto. O Rafa já solicitou meu acesso às bases de CPF e CNPJ, mas ainda não o concederam.

Você sabe me indicar alguma base não restrita que tenho esse campo? Não sei também se seria possível compartilhar uma amostra de valores de complemento pra alguma das bases que você esteja usando. Imagino que não teria grandes problemas quanto à privacidade da informação, já que é só o complemento, mas não sei se isso é permitido.

lucasmation commented 4 months ago

Voce nao está usando CadUnico? TSEE?

acho que podemos sim, vou tentar salvar em: \storage6\usuarios\CGDTI\IpeaDataLab\projetos\enderecos me diz se voce tem acesso para ler/escrever nesta pasta.

dhersz commented 4 months ago

Tenho acesso à pasta sim (já consegui acesso à base de CPFs também).

dhersz commented 4 months ago

Primeira versão nesse commit https://github.com/ipeaGIT/enderecopadrao/commit/a6db4f3332d3a9c1f6384bed687a8d1f18976415 (já usando o novo entendimento de que valores vazios devem ser substituídos por NA, depois atualizo nas outras funções).

Ainda tem muito a avançar, vou deixar aberto até ter uma versão um pouquinho melhor no ar.