Closed topeixoto closed 1 year ago
Opa, obrigado pela issue! Vou verificar e atualizar, não era para ter duplicado.
@topeixoto muito obrigada por ter compartilhado tua sualução, funcionou muito bem aqui!
Será que um inner_join não ajudaria a resolver o problema?!
Problema
Preciso trabalhar com dados do SIM de 2010 à 2020, consegui coletar com sucesso usando o
fetch_datasus
, porém ao tentar processar esse dados usandoprocess_sim
recebi o seguinte erroError in $<-.data.frame(*tmp*, "NATURAL", value = c(101L, 74L, 120L, : replacement has 270384 rows, data has 270367
. Após alguns debugs percebi que isso acontece com dados de SP, GO, RJ para os anos de 2010, 2011, 2012, 2013. Posteriormente, realizei mais alguns debugs e percebi que esse erro é acontece na nessa linha que faz o processamento do campoNATURALIDADE
pois oleft_join
está retornando um número maior de registro do que o original. Depois, realizei mais uns debugs para entender o porquê doleft_join
está retornando mais registro que o o original, então percebi que a tabelatabNaturalidade
tem os seguintes camposcod
duplicados:Minhas questões são:
tabNaturalidade
deveria ter o campocod
duplicado?Para eu conseguir seguir o meu trabalho eu fiz a seguinte manipulação antes de executar o
process_sim
:Porém, não sei se essa é a melhor solução para o problema.
Fico a disposição para mais informações.