mariellemiziara / avanti-bootcamp-cdd

Repositório para atividades do Avanti Bootcamp de Ciência de Dados.
MIT License
0 stars 0 forks source link

Titanic - Machine Learning from Disaster

Imagem do Titanic

Este projeto foi desenvolvido como parte de um bootcamp de Ciência de Dados e tem como objetivo prever a sobrevivência dos passageiros do Titanic, aplicando conceitos fundamentais de aprendizado de máquina. Utilizando dados históricos, buscaremos entender quais fatores mais influenciaram as chances de sobrevivência e como construir um modelo preditivo eficiente.

Justificativa

O naufrágio do Titanic é um dos eventos mais icônicos da história e, com o avanço da Ciência de Dados, podemos usar os dados coletados para analisar os padrões de sobrevivência. Este projeto proporciona uma oportunidade prática para aplicar técnicas de aprendizado de máquina em um cenário realista. Além disso, permite o desenvolvimento de habilidades essenciais para um cientista de dados, como análise exploratória de dados, engenharia de atributos, modelagem e avaliação de modelos.

Através desta análise, buscamos não apenas prever a sobrevivência dos passageiros, mas também aprender a lidar com desafios de limpeza e preparação de dados, entender a importância de cada variável e como aplicar algoritmos de machine learning de forma eficaz.

Questões Abordadas

No decorrer do projeto, abordaremos as seguintes questões:

  1. Quais variáveis influenciam diretamente a probabilidade de sobrevivência?
  2. Como podemos construir um modelo preditivo robusto para prever a sobrevivência dos passageiros?
  3. A engenharia de atributos (feature engineering) pode melhorar o desempenho do modelo?
  4. Existem padrões demográficos ou socioeconômicos que ajudaram a determinar as chances de sobrevivência?

Metodologia

O projeto segue a metodologia CRISP-DM, abordando as etapas fundamentais de um processo de Ciência de Dados:

1. Entendimento do Problema

2. Entendimento dos Dados

3. Preparação dos Dados

4. Modelagem

5. Avaliação

6. Resultados e Conclusão

Resultados Esperados

Ao final deste projeto, esperamos:

Este projeto, além de fornecer uma solução preditiva, servirá como uma prática essencial para reforçar os conceitos e habilidades necessárias em projetos de Ciência de Dados no mundo real.