Open Gurriato opened 3 months ago
@Gurriato Importantisimo y super pertinente tu mensaje en vista a auditorias que hayan por venir. Mirando la muy poca probabilidad de encontrar datos de procesos electorales previos igual hare un intento. Trabaje en el Comando Venezuela para elegir a Henrique Capriles en 2012 y 2013. Me quedan algunos nombres para contactar a ver si tengo suerte.
@Gurriato, mis conexiones estan tibias pero estuvimos mirando la pagina del cne archivadas en archive.org y nos dimos cuentas que es posible acceder a los resultados electorales de la eleccion presidencial del 2012 y 2013, no se puede llegar a nivel de centro de votacion (da error) pero si se puede entrar hasta el nivel parroquial.
Ejemplo de resultados en el Municipio Sucre en Miranda. https://web.archive.org/web/20190831165900/http://www.cne.gob.ve/resultado_presidencial_2013/r/2/reg_130901.html
Dime cual es el valor para ti de tener esto extraido a un formato cercano al de las elecciones de 2024.
Buenas.
Aunque estoy un poco desentrenado por que ha pasado tiempo, precisamente he trabajado como científico de datos // estadístico en procesos electorales desde la empresa privada para gobiernos. Mi idea es hacer un análisis de los resultados para demostrar si los datos presentados en la actas son coherentes o no. También, para tener preparado el pipeline para poner a prueba con los mismos tests a las actas que presente el gobierno de Maduro (si es que lo hace). Como precisamente fingir aleatoriedad es bastante complicado, sobre todo si hace a mano, no debería ser difícil.
Para ello necesitamos: 1- El dataset completo. Este dataset es el completo? (issue 7 por @rusosnith -> https://github.com/andreujuanc/actas-2024/issues/7 ) 2- @andreujuanc Entiendo que los datos provienen del .sqlite del repositorio (No he podido cargarlos todavía). Como habéis obtenido estos datos? scrapeados de la pagina web? Entiendo que es una introducción manual desde el acta. Se han encontrado fallos? 3- Sería de mucha ayuda contar con los mismo datos del proceso electoral anterior. Pero también por lo que he leído hubo mucho cambio de "distrito censal" (esto es bastante malo)
Sientanse libres de aportar ideas. Propuesta de pipeline:
1- Exploratorio de datos: a- Coherencia interna (que los votos agregados coincidan por mesa, distrito y resultado global) b- Distribución estadística
2- Tests a- Aleatoriedad en las unidades y decenas. b- Coherencia geográfica (no sé si se podrá aplicar, típicamente las mesas cercanas geográficamente suelen votar bastante parecido) c- Transferencia de votos dentro de una misma mesa entre procesos electorales
Todo lo que digo arriba habrá que ajustarlo al procesos electoral Venezolano: estado > municipio > parroquia > centro de votación.