nadia-aguiar / praktikum_dh_2022

0 stars 2 forks source link

Esse repositório faz parte do estágio obrigatório, módulo 8 - 3° Semestre -, do mestrado em métodos digitais nas ciências humanas e sociais, da Universidade de Mainz, na cidade de Mogúncia na Alemanha.

O estágio faz parte do programa de cooperação entre a Universidade Nova de Lisboa e a Universidade Federal da Bahia. O professor que tutela o estágio é o Eric Brasil.

O objetivo do estágio é raspar dados da Revista Aceno - Revista de Antropologia do Centro-Oeste - usando linguagem Python e alimentar o repositório do Laboratório de Humanidades Digitais da Universidade Federal da Bahia deixando os dados abertos para que outr_s pesquisador_s e instituições possam utilizar os dados. Ao final do estágio será realizado um workshop contando sobre o processo, bem como a publicação de um artigo em português no site Programing Historian e um relatório em alemão, para a disciplina na universidade.

Instalação

Pré-requisitos:

Para executar o programa é necessário fazer o download ou clonar o código no seu computador. Antes de executar o código é necessário instalar algumas dependências.

O código aqui apresentado foi desenvolvido usando a versão 3.7.6 do Python e por isso o Python3 deve ser ou estar instalado em sua máquina. Caso não esteja instalado, é possível encontrar aqui um guia de instalação para Windows e aqui para Linux e aqui para Mac.

Além de ter instalado Python3 no seu computador, o código precisa de outras dependências e bibliotecas. Para fazer a instalação das mesmas, digite o seguinte comando no Terminal, que deve estar aberto dentro da pasta onde o código foi salvo. Para entender melhor como ocorre a instalação de módulos Python com pip clique aqui

Dentro da pasta onde o arquivo requirements.txt foi salvo, digite:

$ cd <caminho para a pasta>

Instale as dependências necessárias com o seguinte comando:

pip3 install -r requirements.txt

Webdriver e Navegador

Para que o código funcione é preciso ter o navegador Mozilla Firefox instalado assim como o WebDriver para o mesmo. Para saber mais, clique aqui.


Dieses Repository ist Teil des Pflichtpraktikums, Modul 8 - 3. Semester -, des Masterstudiengangs Digitale Methoden in den Geistes- und Kulturwissenschaften der Mainz Universität .

Das Praktikum ist Teil des Kooperationsprogramms zwischen der Universidade Nova de Lisboa und der Universidade Federal da Bahia. Der für das Praktikum verantwortliche Tutor ist Eric Brasil.

Ziel des Praktikums ist Daten aus der Zeitschrift Aceno - Revista de Antropologia do Centro-Oeste (Brasilien) mit Hilfe der Programmiersprache Python zu scrapen und in das LHDUFBA -Repository zu füttern, so dass die Daten anderen Forscher_innen und Institutionen zur Verfügung stehen. Am Ende des Praktikums halte ich ein Workshop über den Prozess. Es wird ein Paper auf portugiesische auf der Website Programing Historian veroffentlichen und ein Bericht auf deutsche für die Universität verfassen.

Installation

Voraussetzungen

Um das Programm auszuführen, müssen Sie den [Code] (https://github.com/nadia-aguiar/praktikum_dh_2022) auf Ihren Computer herunterladen oder klonen. Bevor der Code ausgeführt werden kann, müssen einige Komponenten installiert werden.

Der hier vorgestellte Code wurde mit Python Version 3.7.6 entwickelt. Daher muss Python3 auf Ihrem Rechner installiert sein. Falls nicht installiert wurde, können Sie hier eine Installationsanleitung für Windows, hier für Linux und hier für Mac finden.

Neben der Installation von Python3 auf Ihrem Computer benötigt der Code weitere Bibliotheken und Abhängigkeiten. Um sie zu installieren, geben Sie den folgenden Befehl in Terminal ein, das in dem Ordner geöffnet sein muss, in dem Sie den Code gespeichert haben. Um besser zu verstehen, wie man Python-Module mit pip installiert hier klicken

Geben Sie in dem Ordner, in dem die Datei requirements.txt gespeichert wurde, ein:

$ cd <Pfad zum Ordner>

Installieren Sie die erforderlichen Komponenten mit dem folgenden Befehl:

pip3 install -r requirements.txt