[Participación]: Sebastian Sosa

Señala los requisitos cumplidos

[X] Mi aplicación usa Vercel SDK AI de alguna forma
[X] Mi aplicación está desplegada y funciona

Escribe tu nombre o el del equipo

Sector 7G

Nombre del Proyecto

Severus IA

Descripción del Proyecto

Severus es un asistente que permite, con una orden, ejecutar comandos y automatizar la PC. El proyecto está realizado para escritorio con Tauri.

El proyecto cuenta con dos modos: el modo de preguntas y el de asistente. Para cambiar entre uno y otro, hay que hacerlo con el comando de voz. Por ejemplo, le damos click al núcleo, decimos "asistente" o "preguntas", y observamos el cambio de color entre uno y otro modo.

asistente preguntas

como se comento anteriormente incluye un módulo de voz, lo que permite dar órdenes o hacer preguntas mediante comandos de voz. Para el modelo de reconocimiento de voz se utilizó la api de webkitSpeechRecognition y de modelo de IA Geminis. Para utilizar a el asistente , es necesario crear una API KEY en Google AI y luego ingresarla en el input key que se despliega haciendo clic en la llave del asistente.

api-key-2

Ambos modos tienen la opción de ejecutar consultas u órdenes mediante un input que se activa haciendo clic en la burbuja superior.

asistente-2 preguntas-2

Actualmente, para usar los comandos por voz, hay que otorgarle permiso para usar el micrófono. Una vez concedido el permiso, haciendo clic en el núcleo del asistente se activa el micrófono y empieza a escuchar la orden. Cuando se termina la petición, hay que darle clic nuevamente para que se ejecute. cuando se usa el comando de voz la forma que se puso por el momento de interacion son ventanas del sistema

audio-activo respuesta-asistente

preguntas-respuesta

Las respuestas del asistente se realizan ejecutando acciones en el sistema operativo huésped, como crear carpetas, abrir programas, crear proyectos para desarrollo, abrir el explorador, o cualquier otra petición que se pueda hacer por línea de comandos. Se pensó en realizar acciones más complejas, pero no se alcanzó el tiempo de desarrollo.

Futuras mejoras:

Asistencia por mensajes de WhatsApp. Usar un mejor módulo de voz con IA para mejorar la escucha y la respuesta. Implementar APIs de otros modelos para que el usuario pueda elegir. Integrar APIs de redes sociales para permitir al asistente leer los últimos posteos, etc. Usar Rust, que está disponible en Tauri, para almacenar localmente los comandos que funcionaron, evitando así generar tantas consultas a la IA. personalizar la respuesta con multiples ventanas en tauri. Mejorar el modulo de voz para que no haga falta darle click al terminar Cambio de estilo los botones dentro del nucleo

PD: Se aprendio mucho mas realizando este proyecto que en cualqueir curso tomado , saludos a todos

Esperamos que les guste el proyecto desarrollado.

Repositorio de Código

https://github.com/Animas-Ss/Severus-IA/tree/main

Proyecto desplegado

https://drive.google.com/file/d/1Ep1Ght2u2fdzsA3PiDvABvt3MwpGitmU/view?usp=sharing

Instrucciones de Configuración

asistente preguntas

El proyecto incluye un módulo de voz, lo que permite dar órdenes o hacer preguntas mediante comandos de voz. Para el modelo de reconocimiento de voz se utilizó Geminis. Para su utilización, es necesario crear una API KEY en Google AI y luego ingresarla en el input key que se despliega haciendo clic en la llave del asistente.

api-key-2

midudev / hackaton-vercel-2024