[X] Mi aplicación usa Vercel SDK AI de alguna forma
[X] Mi aplicación está desplegada y funciona
Escribe tu nombre o el del equipo
Sector 7G
Nombre del Proyecto
Severus IA
Descripción del Proyecto
Severus es un asistente que permite, con una orden, ejecutar comandos y automatizar la PC. El proyecto está realizado para escritorio con Tauri.
El proyecto cuenta con dos modos: el modo de preguntas y el de asistente. Para cambiar entre uno y otro, hay que hacerlo con el comando de voz. Por ejemplo, le damos click al núcleo, decimos "asistente" o "preguntas", y observamos el cambio de color entre uno y otro modo.
como se comento anteriormente incluye un módulo de voz, lo que permite dar órdenes o hacer preguntas mediante comandos de voz. Para el modelo de reconocimiento de voz se utilizó la api de webkitSpeechRecognition y de modelo de IA Geminis.
Para utilizar a el asistente , es necesario crear una API KEY en Google AI y luego ingresarla en el input key que se despliega haciendo clic en la llave del asistente.
Ambos modos tienen la opción de ejecutar consultas u órdenes mediante un input que se activa haciendo clic en la burbuja superior.
Actualmente, para usar los comandos por voz, hay que otorgarle permiso para usar el micrófono. Una vez concedido el permiso, haciendo clic en el núcleo del asistente se activa el micrófono y empieza a escuchar la orden. Cuando se termina la petición, hay que darle clic nuevamente para que se ejecute. cuando se usa el comando de voz la forma que se puso por el momento de interacion son ventanas del sistema
Las respuestas del asistente se realizan ejecutando acciones en el sistema operativo huésped, como crear carpetas, abrir programas, crear proyectos para desarrollo, abrir el explorador, o cualquier otra petición que se pueda hacer por línea de comandos. Se pensó en realizar acciones más complejas, pero no se alcanzó el tiempo de desarrollo.
Futuras mejoras:
Asistencia por mensajes de WhatsApp.
Usar un mejor módulo de voz con IA para mejorar la escucha y la respuesta.
Implementar APIs de otros modelos para que el usuario pueda elegir.
Integrar APIs de redes sociales para permitir al asistente leer los últimos posteos, etc.
Usar Rust, que está disponible en Tauri, para almacenar localmente los comandos que funcionaron, evitando así generar tantas consultas a la IA.
personalizar la respuesta con multiples ventanas en tauri.
Mejorar el modulo de voz para que no haga falta darle click al terminar
Cambio de estilo los botones dentro del nucleo
PD: Se aprendio mucho mas realizando este proyecto que en cualqueir curso tomado , saludos a todos
El proyecto incluye un módulo de voz, lo que permite dar órdenes o hacer preguntas mediante comandos de voz. Para el modelo de reconocimiento de voz se utilizó Geminis. Para su utilización, es necesario crear una API KEY en Google AI y luego ingresarla en el input key que se despliega haciendo clic en la llave del asistente.
Señala los requisitos cumplidos
Escribe tu nombre o el del equipo
Sector 7G
Nombre del Proyecto
Severus IA
Descripción del Proyecto
Severus es un asistente que permite, con una orden, ejecutar comandos y automatizar la PC. El proyecto está realizado para escritorio con Tauri.
El proyecto cuenta con dos modos: el modo de preguntas y el de asistente. Para cambiar entre uno y otro, hay que hacerlo con el comando de voz. Por ejemplo, le damos click al núcleo, decimos "asistente" o "preguntas", y observamos el cambio de color entre uno y otro modo.
como se comento anteriormente incluye un módulo de voz, lo que permite dar órdenes o hacer preguntas mediante comandos de voz. Para el modelo de reconocimiento de voz se utilizó la api de webkitSpeechRecognition y de modelo de IA Geminis. Para utilizar a el asistente , es necesario crear una API KEY en Google AI y luego ingresarla en el input key que se despliega haciendo clic en la llave del asistente.
Ambos modos tienen la opción de ejecutar consultas u órdenes mediante un input que se activa haciendo clic en la burbuja superior.
Actualmente, para usar los comandos por voz, hay que otorgarle permiso para usar el micrófono. Una vez concedido el permiso, haciendo clic en el núcleo del asistente se activa el micrófono y empieza a escuchar la orden. Cuando se termina la petición, hay que darle clic nuevamente para que se ejecute. cuando se usa el comando de voz la forma que se puso por el momento de interacion son ventanas del sistema
Las respuestas del asistente se realizan ejecutando acciones en el sistema operativo huésped, como crear carpetas, abrir programas, crear proyectos para desarrollo, abrir el explorador, o cualquier otra petición que se pueda hacer por línea de comandos. Se pensó en realizar acciones más complejas, pero no se alcanzó el tiempo de desarrollo.
Futuras mejoras:
Asistencia por mensajes de WhatsApp. Usar un mejor módulo de voz con IA para mejorar la escucha y la respuesta. Implementar APIs de otros modelos para que el usuario pueda elegir. Integrar APIs de redes sociales para permitir al asistente leer los últimos posteos, etc. Usar Rust, que está disponible en Tauri, para almacenar localmente los comandos que funcionaron, evitando así generar tantas consultas a la IA. personalizar la respuesta con multiples ventanas en tauri. Mejorar el modulo de voz para que no haga falta darle click al terminar Cambio de estilo los botones dentro del nucleo
PD: Se aprendio mucho mas realizando este proyecto que en cualqueir curso tomado , saludos a todos
Esperamos que les guste el proyecto desarrollado.
Repositorio de Código
https://github.com/Animas-Ss/Severus-IA/tree/main
Proyecto desplegado
https://drive.google.com/file/d/1Ep1Ght2u2fdzsA3PiDvABvt3MwpGitmU/view?usp=sharing
Instrucciones de Configuración
El proyecto incluye un módulo de voz, lo que permite dar órdenes o hacer preguntas mediante comandos de voz. Para el modelo de reconocimiento de voz se utilizó Geminis. Para su utilización, es necesario crear una API KEY en Google AI y luego ingresarla en el input key que se despliega haciendo clic en la llave del asistente.