ipeaGIT / enderecopadrao

Pacote de R para padronizar endereços brasileiros
https://ipeagit.github.io/enderecopadrao/
Other
0 stars 0 forks source link

detecção de valores non-sense no logradouro e afins pegando coisas demais #11

Open dhersz opened 1 month ago

dhersz commented 1 month ago

e.g. logradouro = "11" quando padronizado vira NA porque a atual detecção no logradouro considera qualquer valor que começa com um caracter e só ele existe repetido até o fim como non-sense

ou seja, 22, 33, 44, 55, 111, tudo é flagado como non-sense

provavelmente melhor pensar:

dhersz commented 3 weeks ago

também tá pegando coisa de menos.

essa aqui no campo de bairro: "X. X. X. X. X. X. X. X. X. X. X. X. X. X."