Open alexylem opened 8 years ago
il va être utile ce billet j'ai trouvé ça un client à un assistant vocal sur son téléphone androïde avec une belle voix https://docs.api.ai/ si tu trouve cela intéressant pour une amélioration.
Sinon il y a aussi pourquoi pas l'intégration du TTS de bing, tu as déjà intégré bing en STT donc je suppose que l'intégration en TTS doit être similaire, l'Api ne doit pas trop changer !?
Excellent du coup je propose d'utiliser un pc windows avec le Sdk kinect(Speech Api) comme serveur Stt et du coup on indépendant des solutions ;) Je n'ai pas regardé si c'était possible . C'est juste une idée :) 😀
Je parlai de ce produit uniquement pour la voix car je trouve la voix bing bien mais pas assez humaine
On commence à avoir pas mal de ticket pour les nouvelles voix:
Bing api.ai
Va falloir prioriser un peu tout ca 😄
Selon moi, le gros avantage de Jarvis est sa simplicité d'installation/utilisation et non le nombre de TTS/STT avec qui il est intégré. Disons que si on identifie une voix qui est meilleure, plus réactive, avec moins de contraintes et plus facile à installer que ce que Jarvis propose déjà, alors je le fais de suite! Si on propose trop de choix on perd l'utilisateur et on complique la maintenance. Autant se focaliser sur 2 ou 3 choix parmi le top de ce qui se trouve sur le marché à un temps T.
C'est juste mon avis, vous pouvez aussi décider de l'avenir et de la philosophie de Jarvis, car Jarvis ne s'en serait pas la aujourd'hui sans vous! Finalement on va peut-être trouver une utilité à ce ticket... 😄
La possibilité offerte de base d'un mode online et offline le paraît le plus pertinent dans les deux sens. AMHA concentre toi plus sur le coeur de Jarvis tel que toi tu l'ambitionne, à voir si les autres tts et Stt peuvent être externalisé et proposé par des tiers (plugins) Tu précises juste un template. Mais ce n'est que mon avis.
Et que pensez-vous de Mimic? Je viens de tomber dessus par hasard et il m'intrigue un peu ce TTS.
Merci @diyfr tu m'as convaincu. Je vais proposer des templates de STT et TTS et donc me focaliser sur le store de commandes #52 qui me semble être la prochaine évolution essentielle pour la communauté de Jarvis.
Moi en faite je recherche surtout une voix qui fait moins robot, car actuellement je trouve que celui de google translate est moyen ainsi que espok.
@alexylem Tu as raison le gros avantage n'est pas dans les TTS ou SST différent
Après si un jour tu as le temps de faire une documentation du code ou autre qu'on puisse facilement créer nous même les connexions au différent service (via le store ou autre) ça peut être également un plus et nous permettre de plus t'aider sur le point de vue fonctionnalité.
@francoismartin le TTS recommandé est svox_pico
. Il est hors ligne et a un bien meilleur rendu que espeak
, tu l'as essayé?
C'est clair. J'en ai bricolé une version et je trouve le résultat concluant. Bon ça ne vaut pas un Acapela la voix Julie est nickel
@alexylem
Oui désolé pas espeak
mais svox_pico
j'avais essayé vue que vous le recommandé mais je ne suis pas vraiment séduit, je trouves qu'il est pire que google translate
@diyfr Ah je ne connaissais pas Acapela, il y a vraiment beaucoup de monde sur le TTS
Bon Acapela c'est mort. Ils ont un modèle économique pour les industriels. 1000€/an. Je pensais qu'ils auraient eu un modèle similaire à Android.... Donc Picotts reste toujours d'actualité.
Je viens un peu tard (en espérant que le projet soit "SID" comme qu'ils diraient chez Debian :) Je suggère de réfléchir à une fonctionnalité d'IA se basant sur le machine learning.
Par exemple la commande QUELESTTONNOM est enregistrée. Si mainteant j'essaie COMMENTAPPELLETU* ca va me dire que ça ne comprends pas. L'idée serait de voir ordonner à Jarvis : "'Comment t'appelles-tu?' correspond à 'quel est ton nom?'" en vocal juste après l'instruction mal comprise.
EDIT : #526 le point 2 résumé mon idée
@GuillaumeSX : C'est le saint Graal du machine/deep learning/réseaux neuronaux et autres concepts à la mode en ce moment, mais pas évident, tu peux chercher "chatbot" ou "AI chatbot" sur Google. Le soucis c'est que beaucoup sont en Anglais uniquement, comme celui des créateurs de Snowboy: chatbot. Dailleurs, ils viennent de se faire racheter par Baidu, pour dire l'intérêt des gros acteurs au sujet...
Bonjour,
Tu insères la commande comme ceci : QUELESTTONNOM|COMMENTAPPELLETU*==say "Je m’appelle Robert le camionneur !"
Si c’est ça que tu voulais savoir
Tiens-moi au courant
Merci
J
De : Guillaume [mailto:notifications@github.com] Envoyé : vendredi 28 juillet 2017 16:12 À : alexylem/jarvis Cc : Subscribed Objet : Re: [alexylem/jarvis] Evolution de Jarvis - Philosophie, Priorités, Promotion (#88)
Je viens un peu tard (en espérant que le projet soit "SID" comme qu'ils diraient chez Debian :) Je suggère de réfléchir à une fonctionnalité d'IA se basant sur le machine learning.
Par exemple la commande QUELESTTONNOM* est enregistrée. Si mainteant j'essaie COMMENTAPPELLETU ca va me dire que ça ne comprends pas. L'idée serait de voir ordonner à Jarvis : "'Comment t'appelles-tu?' correspond à 'quel est ton nom?'"
— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/alexylem/jarvis/issues/88#issuecomment-318662544 , or mute the thread https://github.com/notifications/unsubscribe-auth/Abm9ZdQXzQ_Q9gr-DBPUVba2yGuDwXTUks5sSexGgaJpZM4Ja3tu . https://github.com/notifications/beacon/Abm9ZR9o-jL0Ngq4bVy-cIcSk59JcrFdks5sSexGgaJpZM4Ja3tu.gif
Merci pour ta réponse @satana888 , mais non, ce n'est pas ça que je voulais savoir. Ce que tu propose peut être trouvé facilement dans la doc openjarvis. L'exemple que je proposais voulait exprimer l'idée d'apprentissage par interactions et non par programmation. Le machine learning.
@Oliv4945 je ne pensais pas forcément à un chatbot, mais plutot à la possibilité pour Jarvis d'apprendre par commande vocale en cas de non-compréhension d'un commande.
@alexylem api.ai si j'ai bien compris n'est pas une nouvelle voix mais un agent d'intelligence artificielle. Je m'y penche quand j'ai le temps.
EDIT : doté du machine learning :D
Bonjour , Merci pour ce super projet ! Je suis "jeune" ici et dans mes projets (tous autour des rpi) J'ai une domotique naissante avec jeedom etj'ai enfin reçu un micro andermachin à 5€ d'aliexpress qui fonctionne très très bien ! J'ai quelques réglages à apporter et je suis persuadé qu'à travers tous ces tickets je vais m'en sortir mais en voyant ce fil une question me taraude .... Un an après l'ouverture par Alexy, quel est maintenant la vision de "ton" bijou pour 2018 ! La concurrence est rude et va s'accuenter (je pense et me trompe peu être) mais quels surprises nous réserves tu ? :-) en espérant avoir une réponse Merci à toi/vous
PS : Cocorico
L'objectif de ce Ticket (à ne jamais fermer) est de discuter avec les plus impliqués d'entre vous sur les prochaines évolutions nécessaires du Core de Jarvis, ainsi que de son positionnement, sa philosophie.