Disciplina dos Cursos de Ciências da Computação e afins da UNINOVE.
NumPy
pandas
pandas
, matplotlib
e seaborn
Scikit-Learn
TensorFlow
, Keras
e PyTorch
Prof. Dr. Edson Melo de Souza - Currículo Lattes - ORCID
Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.
Para configurar um ambiente local:
git clone https://github.com/storopoli/ciencia-de-dados.git
cd ciencia-de-dados
pip install -r .binder/requirements.txt
ou conda env create -f .binder/environment.yml
IF
) FOR
e WHILE
) list
e dict
) NumPy
e Algebra Linear pandas
pandas
estatística matplotlib
e pandas
Scikit-Learn
Scikit-Learn
Scikit-Learn
Scikit-Learn
Scikit-Learn
Scikit-Learn
Scikit-Learn
Scikit-Learn
TensorFlow
e Keras
PyTorch
PyTorch
Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:
pandas.pydata.org
matplotlib/cheatsheets
pytorch.org
afshinea/stanford-cs-229-machine-learning
e também remicnrd/ml_cheatsheet
regex101.com
A avaliação pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:
pandas
pandas
pandas
(groupby
s)pandas
e matplotlib
scikit-learn
de aprendizagem supervisionada (regressor ou classificador) no conjunto de treinoscikit-learn
no conjunto de testeA entrega pode ser via e-mail, mas é extremamente incentivado para que os alunos criem um repositório no GitHub aberto com um README.md
bem escrito que explica o projeto. Isto pode já ser um incentivo para os alunos criarem os seus portfolio de projetos de ciências de dados no GitHub, algo que impulsionaria bastante a carreira deles.
A correção dos trabalhos deverá levar em conta o tamanho dos grupos. Grupos pequenos têm maior tolerância de erros e inconsistências do que grupos com um maior número de integrantes.
Para citar o conteúdo use:
Storopoli & Souza (2020). Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Disponível em https://github.com/storopoli/ciencia-de-dados
Ou em formato BibTeX para LaTeX:
@misc{storopolisouza2020cienciadedados,
author = {Storopoli, Jose and Souza, Edson Melo de},
title = {Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch},
url = {https://github.com/storopoli/ciencia-de-dado},
year = {2020}
}
Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).