vrolim / datamining

0 stars 0 forks source link

Análise Descritiva dos Dados #7

Open vrolim opened 5 years ago

vrolim commented 5 years ago

-p-value -histogramas -correlação de variaveis

rogerioluizsi commented 5 years ago

Complementar com as seguintes informações: 1.Descrição da variável 2.Nível de preenchimento 3.Ganho de informação em relação à variável-alvo 4.Ganho de informação em relação à variável-alvo, normalizado pelo da variável de maior valor Para variáveis numéricas: 5.Média 6.Desvio-padrão 7.Coeficiente de variação (cuidado com o denominador) 8.Valor mínimo 9.Valor máximo 10.Mediana 11.Primeiro decil 12.Nono decil 13.Primeiro quartil 14.Terceiro quartil 15.Distância semi-interquartil (Q3-Q1)/2 16.Razão entre a distância semi-interquartil e a mediana (equivalente do coeficiente de variação para separatrizes) (cuidado com o denominador) Para variáveis categóricas: 17.Quantidade de categorias (distintos) 18.Categoria-moda 19.Freqüência relativa da moda 20.Quantidade de categorias com freqüência relativa acima de 5%