Open pedreirajr opened 2 months ago
Muito bom @pedreirajr ! Obrigado por abrir o issue. Incluir os dados de 2012 de Salvador seria uma otima primeira contribuição da comunidade, e espero que desperte o interesse de outros colaboradores para incluir bases no odbr. O que acha, @hsvab ?
Olá pessoal,
Tudo bem? Parabéns por estarem conduzindo essa iniciativa tão importante! Visando colaborar, eu realizei o processamento dos dados da Pesquisa de Mobilidade da Região Metropolitana de Salvador de 2012. Se for útil, seria muito bacana que a RMS também fosse contemplada pelo
odbr
. Os dados são meio difícieis de encontrar pesquisando na Internet e na página do governo do estado, mas a SEINFRA-BA sempre disponibilizou esse link institucional para download: http://sit.infraestrutura.ba.gov.br/docs/download/publicacoes/suplog/Pesquisa_OD.rar. O passo a passo para o processamento bem como os arquivos produzidos se encontram nesse repositório que montei: https://github.com/pedreirajr/od_rms_2012 O arquivo do README tem uma descrição um pouco mais detalhada do que foi feito por lá. Além da base de dados de viagens e dos arquivos geográficos das zonas e subzonas de tráfego, existem tabelas com outras informações que não são necessariamente trabalhadas noodbr
, mas que podem ser úteis em futuras expansões do pacote. Para os dicionários, pelo formato que disponibilizaram nas planilhas, eu fiz um pré-processamento em formato de listas para os campos (colunas) e códigos das respostas. Todavia, acredito que ainda não atenda ao padrão que vocês já estão trabalhando no pacote com os dados de SP. Porém, como há diversas possibilidades de montar esse arquivo de dicionário final, resolvi esperar para ver com vocês qual a melhor forma possível de organizar.Se for do interesse de vocês essa colaboração, me avisem.
Abraços!
PS: eu cheguei a elaborar um código para baixar os arquivos do link institucional e extraí-los para o repositório. Porém, quando fazia a extração do arquivo .xlsx usando as funções do pacote
archive
no R, o arquivo vinha corrompido. Testei uma solução similar no Python, mas também sem sucesso. Sendo assim, resolvi extrair manualmente os arquivos do .rar e inseri-los direto na pastadata_raw
do repositório.