Open xuxoramos opened 4 years ago
De acuerdo a conversación con @jmcasanueva, la taxonomía de calidad de respuestas, queda como:
Esta nueva taxonomía será usada para generar las 2 variables calidad_respuesta
y calidad_respuesta_real
.
Se reabre este issue para incluir el análisis estadístico ahora de las variables de calidad de respuesta y determinar si existe diferencia estadísticamente significativa entre ambas.
NOTA IMPORTANTE: Es importante considerar que solo se obtuvo el texto extraído de PDFs de los adjuntos en el 50% de las respuestas. Ergo, todo el análisis debe contemplar este factor.
Remark de @dvilla88 : la taxonomía cubre todos los casos, por lo que este 50% solo afectaría a las respuestas que están marcadas como "Información disponible públicamente" y "Información enviada en formato electrónico", y son las únicas que tienen el riesgo de transicionar a "Sin respuesta". El análisis debe contemplar esta transición entre ambas variables.
Para aclarar: el análisis estadístico entre calidades de respuesta implica responder las siguientes preguntas:
NOTA: Este issue no es para el sprint del 18 de Junio al 25 de Junio.
Una vez procesados los textos extraídos de los adjuntos en PDF especificados en #18 y #23, se debe realizar un EDA que responda lo siguiente:
calidad_respuesta
ycalidad_respuesta_real
definida en #19 , comparar ambas variables y determinar si hay diferencia estadísticamente significativa entre una y otra - la hipótesis es que mediante los adjuntos se rechazan más solicitudes de las que reporta el INAI.A DISCUSIÓN: qué feature se puede generar de este análisis? Es posible que ninguno, dado que esto es en el agregado de las respuestas y no en las individuales.