augustoqm / cg-insights

Repositório de Análises dos dados da Câmara Municipal de Campina Grande
Apache License 2.0
2 stars 0 forks source link

Redução do número de temas #9

Closed nazareno closed 8 years ago

nazareno commented 8 years ago

Estou imaginando algo como PCA para entendermos a atuação dos vereadores a partir de poucas dimensões. Alguns testes com os vereadores da legislatura que acaba em 2016 parecem mostrar que 3 CPs explicam 90%+ da variância dos temas originais.

nazareno commented 8 years ago

Ué, não posso fazer assign pra mim nem adicionar labels às issues? @augustoqm ?

augustoqm commented 8 years ago

Oxe @nazareno, é só pedir. =) Já mandei lá. Adicionei o time todo tb.

A ideia é show! Vocês já fizeram isso com os deputados e deu muito certo. Dá também pra os vereadores. Vamos ver, gera a viz e a gente bate com o que esperamos.

augustoqm commented 8 years ago

Outra ideia @nazareno é usar o TSNE. Já usei e ele é bem interessante, já gera os componentes otimizado para visualização.

nazareno commented 8 years ago

A ideia de usar o tSNE e gerar visualização é muito boa também. Eu estava ainda no passo anterior. Pensei que era uma boa ter um conjunto pequeno de dimensões que conseguimos explicar. Algo tipo "Causas de minorias", "Serviços urbanos e afins", etc. Aí eu acho que podia ser 3 ou mais. Pra ficarem explicáveis, pensei em PCA.

augustoqm commented 8 years ago

Sim @nazareno, entendi! É uma boa, podemos criar mas antes vou olhas as comissões tecnicas pq elas tem focos bem definidos. Vou fazer isso esse fds e iteramos com o resultado.