basedosdados / queries-basedosdados

🔍 Gerenciador de modelos de transformação de dados (ELT) no datalake
9 stars 4 forks source link

[bug] `br_ibge_censo_demografico` #792

Open rdahis opened 1 month ago

rdahis commented 1 month ago

Reportado por um usuário: "Estou mandando essa mensagem porque estou usando os dados do Censo demográfico de 1980 e a variável v607 (Rendimento bruto na ocupação principal) está com missing values para todos os estados, exceto o Ceará. Usando os dados obtidos através do pacote DataZoom (desenvolvido e mantido pela PUC-RJ) no Stata, a variável v607 está ok, então não parece ser um problema com os dados brutos fornecidos pelo IBGE."

rdahis commented 1 month ago

@laura-l-amaral te marquei para notificar mas pode realocar como encaixar melhor com a equipe, claro.

luizbrotherhood commented 1 month ago

Oi, gente. Sou a pessoa que mandou a mensagem para o @rdahis. Complementando o comentário: parece que isso está acontecendo com várias variáveis relacionadas a rendimento no Censo 1980. Por exemplo, v680 v607 v608 v682 v609 v610 v611 v612 v613.

laura-l-amaral commented 4 weeks ago

Oi @luizbrotherhood a dificuldade que temos com esses dadso é que ninguém mais da equipe tem o stata para conseguir fazer o download dos dados novamente, você consegue fazer o download pra que a gente possa usar para atualizar os dados?

luizbrotherhood commented 2 weeks ago

Oi Laura, obrigado pela resposta. Eu tenho os dados aqui: https://www.dropbox.com/scl/fo/2oipq2eg121v1cgobcpab/ABOxeFrvDcRAqjkqO9QU7ig?rlkey=eix2dz4v7lu49csnxdbk9rpgf&dl=0. Os dados brutos, como baixados do Base dos Dados, está nas pastas "raw", em csvs. É preciso fazer o append de todos os csvs para ter a base completa.

laura-l-amaral commented 2 weeks ago

muito obrigada! @luizbrotherhood vou tentar incluir o ajuste destes dados na próxima sprint!