Accenture-Data-Engineer / Trabalho-final-grupo2

1 stars 3 forks source link

criar documentação (readme.md) #7

Open jonesamandajones opened 1 year ago

brunabellini commented 1 year ago

Já criei meio que um white label do readme, vai faltar finalizar com os arquivos, textos e informações adicionais

brunabellini commented 1 year ago

parte da descrição de spark e uso no nosso trabalho ja colocada, com um plus do pandas utilizado,tambem já comecei a colocar nome de integrantes e algumas infos

jonesamandajones commented 1 year ago

É bom deixar claro q apesar de entendermos que dados são normalmente sensíveis e que devem ser protegidos, nosso código disponibiliza os dados por estes serem fictícios e serem parte da avaliação do nosso trabalho.

jonesamandajones commented 1 year ago

(Documentação pra utilização do Docker Compose):

Como usar o Jupyter notebook com Pyspark via docker-compose no VSCode:

  1. Criar uma pasta e salvar o arquivo docker-compose.yaml disponível neste repositório.

  2. No terminal Linux usar os seguintes comandos:

    sudo apt install docker (instalar o Docker)

    sudo apt install docker-compose (instalar o Docker Compose)

    sudo service docker start (Iniciar o docker)

    sudo docker-compose up (Subir o Docker)

  3. Copiar o link informado via terminal ao final da conexão (formato: http://:/?token=)

  4. Criar um arquivo na pasta do docker de extensão .ipynb (um notebook jupyter)

  5. Abrir a pasta no VS Code, iniciar o notebook e clicar no botão de selecionar kernel seguindo as seguintes etapas:

    Select another kernel:

    Existing jupyter server:
    
        Colar o link e selecionar a versão Python identificada.
jonesamandajones commented 1 year ago

Criando variáveis de ambiente

Na pasta raiz do código, crie um arquivo chamado .env com as seguintes informações: SERVER={informe o servidor do banco de dados} DATABASE={informe o nome do banco de dados} USERNAME={Informe o nome de usuário} PASSWORD={Informe a senha}

Importante: lembre-se de substituir os valores entre {} pelos valores do banco de dados que deseja acessar.

brunabellini commented 1 year ago

read me finalizado com todas as informacoes, links e revisado pelo grupo