vinciusb / TP-AD

0 stars 0 forks source link

Análise de Subgrupos e Padrões Frequentes na Base de Dados do Stack Overflow 2023

Este repositório contém o código e a documentação relacionados ao projeto de análise de subgrupos e mineração de padrões frequentes na base de dados de pesquisa do Stack Overflow de 2023. O objetivo principal deste trabalho é identificar e analisar subgrupos de desenvolvedores com características comuns, especialmente em relação às faixas salariais.

Conteúdo

A pesquisa anual do Stack Overflow coleta uma ampla gama de informações sobre desenvolvedores de software, incluindo tecnologias favoritas, níveis de experiência, preferências de trabalho e faixas salariais. Este projeto utiliza técnicas de mineração de dados para descobrir padrões e agrupar os respondentes com base em características comuns, com um foco especial nas faixas salariais.

Objetivos

  1. Identificar subgrupos com base em faixas salariais: Agrupar desenvolvedores que compartilham características comuns em diferentes faixas de salários.
  2. Descobrir padrões frequentes: Encontrar combinações comuns de características entre os desenvolvedores dentro de cada faixa salarial.
  3. Fornecer insights salariais: Analisar as tendências e preferências da comunidade de desenvolvedores em diferentes faixas salariais.

Metodologia

A metodologia utilizada neste projeto inclui:

  1. Coleta de Dados: Utilização da base de dados do Stack Overflow 2023.
  2. Pré-processamento: Limpeza e transformação dos dados para garantir qualidade e consistência.
  3. Mineração de Padrões: Aplicação de algoritmos de mineração de padrões frequentes (FP-Growth)
  4. Análise de Subgrupos: Uso de algoritmos de SD para identificar subgrupos de desenvolvedores com características comuns em diferentes faixas salariais.

Resultados

Os resultados incluem uma série de padrões frequentes e subgrupos identificados, especialmente focados em características comuns em diferentes faixas salariais. Detalhes completos e visualizações dos resultados podem ser encontrados no arquivo stackoverflow.ipynb.

Referências