Interaction via Reconnaissance vocale

Bonjour,

Je sais que le sujet a déjà été abordé mais je trouve tout de même que cela serait un bon plus pour Gladys.
De ce fait je suis tombé sur un projet OpenSource qui fait ce boulot et qui a l’air pas mal du tout :

Sirius : https://github.com/claritylab/sirius

Le projet a un socle en python avec des exécution serveur via script shell , mais il contient aussi un front-web avec du js. Je n’ai pas encore beaucoup exploré le sujet mais c’est possiblement envisageable de l’intégrer en tant que module avec node.js.

Si cela intéresse , je peux regarder de mon coté et apporter mon retour, voir des sources si cela est convaincant.

Cordialement

C’est vrai que ça pourrait être pas mal.

“Gladys je suis rentré” (et le problème de détection de l’utilisateur est réglé :slight_smile: )

Oui tout à fait.

ou alors :
Gladys :“Bonjour maitre, tu as deux notifications en attente veux tu que je te les lise ?”
Gladys {listening 10s}
si “oui, ouais, vas y, envois, balance”
then "execute proc {lecture notification}
else nothing

Une partie validation vocale des actions peut vraiment etre sympas a intégrer pour éviter qu’elle balance tt tt le temps…

++

Bonjour,

Après analyse un peu plus poussé et test de l’application , il s’avère qu’elle est plutôt efficace et très intéressante , mais le plus gros point et qui nous concerne c’est que c’est une application beaucoup trop lourde et exigeante ( en version initiale) pour une raspberry PI ou arduino , car elle est notamment très gourmande en RAM ( environ 4 GB a plein régime). Si on veut l’intégrer a Gladys , il faudrait prévoir un vrai serveur , ce qui n’est pas l’objectif.

Néanmoins la logique système et métier de l’application est intéressante , je vais voir si je en peux pas récupérer simplement le module de reconnaissance vocale ( CMU Sphinx + KALDI ) ,qui est assez efficace , pour essayer de développer un module de gestion d’ordre simple et paramétrable ( a chacun de faire sa liste d’ordre ).

Cordialement

Pour les utilisateurs Androïd regardez Autovoice/Tasker vous verrez que c’est une mine d’or :slight_smile:

Bonjour je developpe le projet voxgenerator sur linux ecrit en python. Si cela vous interesse il utilise pockrtsphinx il est en developpement

Bonjour,

J’ai effectivement regarder un peu ce que faisait CMU sphinx mais je me suis plutôt orienté sur KALDI vu que c’est une souche en C++.

Néanmoins je suis tout de même intéressé afin d’avoir une approche de quelqu’un ayant déjà attaqué un projet sur ce type de technologie qu’est l’ASR.

Cordialement

Ok moi j’ai utlisé gstreamer et le plugin pocketsphinx. Pocketsphinx est utilisable en C++
Je connaisais pas kaldi je vais regarder cette nouvelle alternative.

Il me semblait que Sphinx était en python, je regarderais ça.

Sphinx4 est en jave. Pocketsphinx est en C ou C++

Bonsoir
je suis super interessée par ce sujet. Je viens d’installer gladys voice et je suis desespere de ne pas trouver de solution spreech to text dans tout ce magnifique projet à part s’en remettre à google encore une fois. Je n’ai besoin que de peu de phrases (donne moi l’heure, quel temps il va faire demain, je pars de la maison, j’ai un rdv…) . Des choses tres basiques. J’installe mon fils jeune handicapé seul et je voudrais me servir de gladys pour l’aider à s’organiser simplement. lui rappeler qu’il a piscine demain et qu’il doit preparer ses affaires ce soir pour ne pas se mettre en retard au travail le lendemain mais pour ca il faut qu’il puisse lui dire qu’il a piscine demain. J’ai essayé jarvis qui propose cette solution mais ppppffff trop peinible a paramétrer.
Donc, peux tu me donner ton retour d’expérience, l’avancement de ce projet et … tes sources MDR parce qu’honnetement meme si je travaille dans une DSN ca fait longtemps que je ne programme plus et j’ai du mal à me mettre à tous ces nouveaux languages. Heureusement qu’il y a google pour le coup :wink:
merci