Eduardo Dalcin e Henrique Pinheiro
O início deste projeto tinha uma motivação e justificativa mais modesta, como pode ser visto na versão 1 do README. Entretanto, com o avançar do desenvolvimento da ferramenta, o escopo do projeto se ampliou.
No início, o foco do projeto era apenas ler o arquivo "Darwin Core" da Flora e Funga do Brasil, publicado no IPT do JBRJ, e convertê-lo para o formato JSON, incluindo os documentos das "espécies" no MongoDB, um banco de dados orientado à documentos, gratuito e de código aberto. Como "bônus", uma interface de consulta simples também foi criada, que também funciona como API, para consumir as fichas de espécie no formato JSON.
Com a publicação dos dados do Catálogo Taxonômico da Fauna do Brasil no IPT do JBRJ, surgiu a ideia de também incorporar os dados da fauna no banco de dados, tendo as fichas das espécies da fauna e da flora unificadas no banco de dados.
Uma vez que o código implementado era genérico o suficiente para reconhecer e automatizar a conversão de diferentes "cores", como o de "ocorrências", surgiu a ideia então de criar uma coleção no mesmo banco de dados dedicado para ficha de ocorrências da flora e da fauna, nos diferentes IPTs públicos.
Desta forma, o banco criado por esta ferramenta hoje conta com cerca de 278 mil nomes de espécie e cerca de 12 milhões de fichas de ocorrências, provenientes de 458 recursos publicados em 10 diferentes IPTs.
Um dos aspectos mais significativos desta proposta é que todo o banco de dados é atualizado em poucos minutos, apenas clicando nas "actions" de atualização da fauna, flora e ocorrências.
Um conjunto de APIs está disponível aqui para consulta a base de dados:
https://dwca2json.deno.dev/api
https://dwca2json.deno.dev/mapa
Criticas, sugestões e "issues" são sempre bem-vindas!