midudev / hackaton-vercel-2024

¡Participa y gana premios de Vercel!
212 stars 18 forks source link

[Participación]: <Erick Pulla> #45

Open epulla opened 3 months ago

epulla commented 3 months ago

Señala los requisitos cumplidos

Escribe tu nombre o el del equipo

Erick Pulla

Nombre del Proyecto

Revelant Charts

Descripción del Proyecto

Mi proyecto te permite, a partir de un dataset (.csv separado por commas ,), generar gráficos estadísticos de la utilizando IA.

image

https://github.com/user-attachments/assets/1c78ac57-70c1-4bcf-a4d0-770f0d722532

¿Cómo funciona?

La IA será capaz de comprender el dataset a partir de sus columnas y de los primeros registros (filas) del dataset. Luego, a partir de ese contexto aprendido, la IA podrá escoger las métricas mas importantes de la lista de fórmas de cálculos soportados y los gráficos estadisticos de lista de gráficos soportados más su puntuación de relevancia para el usuario.

¿Qué utiliza?

Limitaciones

Como se describe en la sección de ¿Cómo funciona?, los gráficos estan limitados por lo que actualmente puede soportar el código. El código es muy mejorable ya que es mi primera vez utilizando Nextjs. Cualquier retroalimentación es bienvenida 😁

Repositorio de Código

https://github.com/epulla/relevant-charts

Proyecto desplegado

https://relevant-charts.vercel.app/

Instrucciones de Configuración

Puedes instalar el proyecto siguiendo las instrucciones del Readme 📖 https://github.com/epulla/relevant-charts?tab=readme-ov-file#instalaci%C3%B3n-local

sk3st0ck commented 2 months ago

Hola @epulla estuve haciendo unas pruebas con datasets grandes que tengo de algunos proyectos que tengo (alrededor de 10 columnas y 2000 filas) y al parecer no funciona del todo bien eso si con datasets pequeños funciona muy bien. Te adjunto una captura

image

epulla commented 2 months ago

Hola @sk3st0ck! Primeramente muchas gracias por probar la app ❤️ En efecto, la app no es muy precisa en sus cálculos cuando se analizan datasets complejos y de un tamaño mediano-grande. Esto ocurre debido a que los cálculos son realizados utilizando vanilla javascript, además de que los datos se cargan en memoria del navegador (evité cargar muchos datos al hosting de Vercel para no llegar al límite del plan hobby fácilmente), lo cual no es la manera más óptima de hacerlo.

Lo ideal sería tener un backend que realice los cálculos. Tengo un plan de crear uno con FastAPI y Python (utilizando las librerías como numpy y pandas) para optimizar los cálculos. Sin embargo, por temas de tiempo no lo he podido concretar.

De todas formas, actualizaré este hilo si alcanzo a realizar el backend hasta antes de culminar con el tiempo límite del Hackaton 😁

P.S.: Si no es mucha molestia, te sería posible compartirme el dataset que probaste para generar los gráficos de tu comentario? Me gustaría probar cómo el código actual estaría calculando las métricas de tus datos 🙇