A equipe deve entregar e apresentar uma análise exploratória dos dados (exploratory data analysis, EDA). Nesse ponto, o projeto terá finalizado a fase de entendimento dos dados na metodologia CRISP-DM. Desse modo, os pontos a serem observados na execução são:
[x] Proposta do projeto: a equipe deve compreender completamente, de uma perspectiva de negócios, o que realmente deve ser feito no projeto, em seguida, modificar o arquivo README.md, contendo um resumo do projeto que será construído. Tente apresentar uma justificativa para o projeto. É desejável que também se insira um graphical abstract.
[x] Coleta inicial de dados: a equipe deve apresentar um conjunto de dados "cru", no repositório do projeto, salvo na pasta data/raw/.
[x] Criação do dicionário de dados: a equipe deve criar um arquivo (ou vários) de dicionário de dados, contendo informações referentes aos conjuntos de dados utilizados no projeto. Serão arquivos no formato CSV, que devem ser guardados na pasta data/external/;
[x] Exploração de dados: a equipe deve criar um notebook de análise exploratória notebooks/01-exploratory_data_analysis.ipynb, contendo as seguintes seções de texto: Descrição dos dados, Perguntas de partida e hipóteses, Insights, de acordo com o conteúdo visto em aula;
[x] Apresentação de resultados: a equipe deve produzir uma apresentação de slides de no máximo 5min para ser apresentada ao professor e o restante da turma.
Coleta inicial de dados e criação do dicionário de dados
[x] Adicionou o conjunto de dados na pasta data/raw/?
[x] Criou e salvou o dicionário de dados na pasta data/external/?
Exploração de dados
Pontos positivos
[x] Escreveu uma descrição dos dados?
[x] Falou sobre dados faltantes?
[x] Escreveu perguntas e partidas de hipóteses?
[x] Utilizou mais que 3 tipos de gráficos?
[x] Escreveu um sumário dos insights no final?
[ ] Criou gráficos que não foram vistos em aula?
[x] Fez análise univariada?
[x] Fez análise bivariada?
[x] Fez análise multivariada?
Pontos negativos
[x] Usou canal de cor sem necessidade?
[x] Utilizou rótulos inclinados?
[x] Utilizou gráfico de dispersão quando deveria ter utilizado gráfico de boxplot?
[x] Não ordenou gráficos de barra quando deveria?
Comentários
Parabéns pelo trabalho, gente. Embora na análise vocês tenham cometido alguns errinhos (de perfumaria), a análise está bem completa, com bastante visualizações e insights interessantes. Com certeza os próximos passos serão mais simples.
Tentem revisar o notebook verificando os pontos negativos e tentando removê-los.
A equipe deve entregar e apresentar uma análise exploratória dos dados (exploratory data analysis, EDA). Nesse ponto, o projeto terá finalizado a fase de entendimento dos dados na metodologia CRISP-DM. Desse modo, os pontos a serem observados na execução são:
Proposta do projeto
: a equipe deve compreender completamente, de uma perspectiva de negócios, o que realmente deve ser feito no projeto, em seguida, modificar o arquivoREADME.md
, contendo um resumo do projeto que será construído. Tente apresentar uma justificativa para o projeto. É desejável que também se insira um graphical abstract.Coleta inicial de dados
: a equipe deve apresentar um conjunto de dados "cru", no repositório do projeto, salvo na pastadata/raw/
.Criação do dicionário de dados
: a equipe deve criar um arquivo (ou vários) de dicionário de dados, contendo informações referentes aos conjuntos de dados utilizados no projeto. Serão arquivos no formato CSV, que devem ser guardados na pastadata/external/
;Exploração de dados
: a equipe deve criar um notebook de análise exploratórianotebooks/01-exploratory_data_analysis.ipynb
, contendo as seguintes seções de texto: Descrição dos dados, Perguntas de partida e hipóteses, Insights, de acordo com o conteúdo visto em aula;Apresentação de resultados
: a equipe deve produzir uma apresentação de slides de no máximo 5min para ser apresentada ao professor e o restante da turma.