Interacción por Texto: Permite enviar consultas de texto y recibir respuestas generadas por un modelo LLM.
Salida de Voz: Convierte las respuestas generadas por el modelo en audio usando xTTS.
Modelo Local: Utiliza un modelo LLM almacenado localmente mediante el programa ollama para garantizar la privacidad y reducir la latencia.
Python 3.10. : https://www.python.org/downloads/release/python-3109/
Ollama. Descargalo desde su web oficial : https://ollama.com/
Git. : https://git-scm.com/downloads
Minimo una grafica con 4 de VRAM
En una carpeta de tu eleccion en la barra de direcciones escribe Cmd y presiona enter.
Aparecera una consola donde debes pegar el siguiente codigo.
git clone https://github.com/futurediffusion/Waifu-texto-ollama-xtts.git
Ejecuta el archivo Xtts-fullinstall.bat , y espera que se instalen todas las dependencias necesarias para el funcionamiento de Xtts . Esta consola se cerrara sola al terminar el proceso.
elige la voz que quieras usar, solo necesitas un audio de 10 segundos formato wav, de preferencia que sea mono, y de 22050 hz para mayor velocidad, puedes editar tu audio de esta manera con un programa gratuito como audacity. https://www.audacityteam.org/
De nombre colocale speaker y Luego guarda este archivo dentro de la ruta xtts-venv\Scripts\speakers
Ejecutar el archivo xtts-Run.bat , se abrira una consola, espera a que aparezcan letras verdes, y manten esta consola abierta mientras utilices el programa.
abre el archivo texto.py , con segundo click y elige bloc de notas o notepad ++ Y en la linea numero 15
llm_model = ollama.chat(model='NOMBREDETUMODELO', messages=[
Sustituye NOMBREDETUMODELO por el nombre de el modelo LLM de ollama que tengas instalado, y guarda el archivo.
Para crear un modelo con una personalidad customizada, mira mi video sobre ollama que dejara en la seccion de links utiles
Ejecuta el archivo Run-texto.bat , Una vez abierto este instalara las dependencias necesarias , se conectara automaticamente con la api de Xtts . espera que aparezca el mensaje Por favor, ingrese el texto: y podras escribirle al modelo local.
Para mas diversion utiliza este programa junto a un modelo Vtuber con el programa vtube studio el cual es gratuito en steam. Asegurate de configurar tu salida de audio de escritorio , en la configuracion de audio de el programa, y en el parametro mouth open de el personaje.