cpdoc / dhbb

Dicionário Histórico Biográfico Brasileiro
Other
10 stars 2 forks source link

+Title: Dicionário Histórico-Biográfico Brasileiro - DHBB

(English Version at [[README-EN.org]])

O projeto do DHBB começou a ser desenvolvido na FGV CPDOC em 1974, produzindo seu primeiro resultado dez anos depois. Era um tempo em que o acesso à internet ainda não era generalizado. Pesquisar sobre temas da história contemporânea do Brasil, além de exigir o domínio da bibliografia pertinente, significava sair em campo para localizar arquivos, consultar coleções de jornais, obter anuários e anais oficiais, entrevistar pessoas.

Publicar significava editar volumes em papel. Exatamente o que foi feito, com a primeira edição do DHBB saindo em 1984, com seus quatro volumes e 4.493 verbetes. Ao consolidar informações até então esparsas com o devido registro das fontes consultadas, a enciclopédia sobre a elite política brasileira tornou-se pioneira, consolidando-se como obra de referência para novas pesquisas. Lançada em 2001, a segunda edição do DHBB atualizou os verbetes existentes e incluiu novos, atingindo um total de 6.620 entradas. Uma novidade chamou a atenção na época: a dupla publicação, em papel e em CD-ROM.

Iniciado novo processo de atualização, num mundo em que a revolução da informática era fato consumado e novos caminhos se abriam à pesquisa histórica, realizaram-se concomitantemente estudos visando à democratização do acesso ao DHBB. Em 2010, nova versão do Dicionário, pôde ser assim oferecida na web, com acesso gratuito e aberto a todos. São 7.553 verbetes, sendo 6.584 de natureza biográfica e 969 verbetes temáticos, relativos a instituições, eventos e conceitos de interesse para a história do Brasil pós-1930.

Todos os verbetes agora podem ser consultados e lidos na íntegra a partir da base de dados integrada do Acervo do CPDOC. Para acessar basta se cadastrar gratuitamente na própria página de busca

[[http://www.fgv.br/cpdoc/busca/]]

Este repositório contém os arquivos dos verbetes em formato texto com respectivos metadados. Estes arquivos contém os mesmos conteúdos que podem ser consultados no link acima.

O principal objetivo deste repositório é dar acesso integral ao DHBB à pesquisadores interessados no processamento automático dos textos, inclusive para efeito de mineracao de dados.

Cada arquivo no diretório =text= contém metadados e o texto dos verbetes. Os arquivos são codificados em UTF-8. No cabeçalho, iniciado e terminado com linhas contendo três hífens =---=, temos os metadados do verbete no formato [[https://yaml.org][YAML]]. O texto dos verbetes é codificado em [[https://daringfireball.net/projects/markdown/][Markdown]] mas no momento, apenas separadores de seções são usados.

Veja o arquivo LICENSE

Convidamos qualquer usuário deste repositório ou usuário do site [[http://www.fgv.br/cpdoc/busca/]] que encontre imprecisões nos textos do DHBB, a criar um ISSUE neste repositório indicando o problema encontrado.

A criação de novos verbetes ou significativas mudanças em seus conteúdos são, no entanto, objetivo de avaliação e aprovação pela equipe do DHBB, que detem a prerrogativa de gestão editorial do corpus.

O DHBB adota o [[https://semver.org/lang/pt-BR/][versionamento semântico]]. A primeira release usando este versionamento é a 1.0.0. O critério para novas releases será: