storopoli / ciencia-de-dados

Disciplina de Ciências de Dados da UNINOVE
Creative Commons Attribution Share Alike 4.0 International
122 stars 92 forks source link
aprendizagem-de-maquina aprendizagem-profunda ciencia-de-dados data-science deeplearning machinelearning matplotlib pandas python pytorch scikit-learn tensorflow

Ciência de Dados

CC BY-SA 4.0 Open in Visual Studio Code Hits

Disciplina dos Cursos de Ciências da Computação e afins da UNINOVE.

backprop

Conteúdo

Professores

Como usar esse conteúdo?

Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.

Para configurar um ambiente local:

  1. Clone o repositório do GitHub: git clone https://github.com/storopoli/ciencia-de-dados.git
  2. Acesse o diretório: cd ciencia-de-dados
  3. Instale as bibliotecas necessárias: pip install -r .binder/requirements.txt ou conda env create -f .binder/environment.yml

Notebooks

Cheat Sheets

Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:

Proposta de Avaliação da Disciplina

A avaliação pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:

  1. Leitura de dados com pandas
  2. Manipulação e limpeza de dados com pandas
  3. Descritivo e exploração de dados com pandas (groupbys)
  4. Figuras que mostrem insights sobre os dados com pandas e matplotlib
  5. Quebrar os dados em conjunto de treino e conjunto de teste
  6. Treinar um estimador do scikit-learn de aprendizagem supervisionada (regressor ou classificador) no conjunto de treino
  7. Verificar o desempenho do estimador do scikit-learn no conjunto de teste

A entrega pode ser via e-mail, mas é extremamente incentivado para que os alunos criem um repositório no GitHub aberto com um README.md bem escrito que explica o projeto. Isto pode já ser um incentivo para os alunos criarem os seus portfolio de projetos de ciências de dados no GitHub, algo que impulsionaria bastante a carreira deles.

A correção dos trabalhos deverá levar em conta o tamanho dos grupos. Grupos pequenos têm maior tolerância de erros e inconsistências do que grupos com um maior número de integrantes.

Como citar esse conteúdo

Para citar o conteúdo use:

Storopoli & Souza (2020). Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Disponível em https://github.com/storopoli/ciencia-de-dados

Ou em formato BibTeX para LaTeX:

@misc{storopolisouza2020cienciadedados,
  author = {Storopoli, Jose and Souza, Edson Melo de},
  title = {Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch},
  url = {https://github.com/storopoli/ciencia-de-dado},
  year = {2020}
}

Trabalhos Finais de Destaque

Licença

Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).

CC BY-SA 4.0