cuducos / minha-receita

🏢 Sua API web para consulta de informações do CNPJ da Receita Federal
https://minhareceita.org
MIT License
1.29k stars 129 forks source link

0 cnpjs depois de longo tempo de processamento #176

Closed anapaulagomes closed 1 year ago

anapaulagomes commented 1 year ago

Baixei os dados de dezembro de 2022 e executei o minha-receita transform -d data/. Tudo pareceu rolar bem - demorou entre 12 e 24 horas para executar tudo, incluindo os índices. Mas ao executar uma consulta no banco vi que não tinha nenhum registro lá. 💔 Ideias?

anapaulagomes commented 1 year ago

Ah, só pra dar um pouco de contexto do que preciso: quero extrair todos os logradouros e seus tipos para treinar um modelo que identifica endereços no https://github.com/DadosAbertosDeFeira/tomba/.

cuducos commented 1 year ago

Mas ao executar uma consulta no banco vi que não tinha nenhum registro lá. 💔 Ideias?

Muito estranho, nunca vi isso. Acho que vou precisar de mais detalhes para pensar em algo:

cuducos commented 1 year ago

Ah, uma dica: não sei o porquês (@gomex, acode), mas o processo de escrita do banco de dados do Docker é extremamente lento (digo isso pois tu mencionou 12-24h). Com PostgreSQL rolando direto no sistema operacional aqui roda em pouco mais de 2h.

anapaulagomes commented 1 year ago

Vou tentar instalar o postgres local pra testar novamente. Valeu!

cuducos commented 1 year ago

Com o comando docker-compose run --rm minha-receita create. Mas como estava dando erro, rodei com o minha-receita transform -d data/ local 🤔

Acho que aí pode ter desencontro. Com o docker-compose ele lê o DATABASE_URL do .env. Quando você rodou local, será que não tinha outra DATABASE_URL configurada?

anapaulagomes commented 1 year ago

Não, não tinha. O .env tá apontando pro banco do docker-compose mesmo. Mas boa dica essa de rodar com o postgres local. Instalei aqui e vou rodar. :)

anapaulagomes commented 1 year ago

Deu certo :) 92GB

anapaulagomes commented 1 year ago

Obrigada!