Senator Investment Data Science Project
Como Rodar?
Python 3.11 (ou mais recente)
- Instale pacotes:
pip3 install -r requirements.txt
- Construa seus dados (opcional):
python3 -m scripts.mine_data
- Rode o algoritmo de machine learning:
python3 -m scripts.train_model
Minerando dados de ações de senadores, pegando o preço
Demonstra precisão do sklearn de 100% usando validação cruzada
Projeto de Data Science
- Quem são os senadores que mais acertam investimentos: Tem dois tipos de acerto, verdadeiro positivo (comprou ação e valorizou) e verdadeiro negativo (vendeu a ação e baixou);
- Normalizar os dados;
- Separar um conjunto de retenção;
- Medir entropia e ganho de informação de cada atributo;
- Definir o nó raiz da árvore que mais vai ter relevância;
- Criar subgrupos (sim e não);
- Testar contra conjunto de retenção;
- Voltar ao passo 4 com subgrupo;
- Quando bater a condição de parada, plotar o gráfico de sobreajuste;
- Escolher o melhor número de nós para ávore de decisão;
- Objetivo: Decidir quais são os atributos mais relevantes para dizer quais investimentos mais prevem o mercado, ou seja, quais investimentos são os melhores que mais refletem na realidade?
Crie uma ferramenta que você insira um investimento (do futuro ou conjunto de retenção) e ele mostre qual a probabilidade dele ser um bom investimento baseado nos dados históricos dos atributos da transação