Gladys 4 - Reconnaissance vocale

Félicitations @damalgos et bon courage :grin:

2 « J'aime »

Du coup pour répondre à ta question, j’ai avancé sur un module, ce qu’il fait actuellement (tout côté back)

  • installer le conteneur rhasspy (qui contient tous les éléments pour comprendre et parler)
  • configurer le conteneur (encore en cours)
  • récupérer le contenu de la voix et l’envoyer à Gladys
  • Gladys réponds à rhasspy qui parle dans le haut parleur

Il reste beaucoup à faire:

  • toute la partie front, j’ai rien fais et un peu la flemme j’aime pas trop ça mais va falloir s’y mettre quand le back sera bon)
  • Installation de rhasspy proprement avec une bonne conf
  • Récupérer la base de données de mozzilla pour la compréhension qui est hyper complète, téléchargement d’une grosse base ça peut poser des problèmes technique
  • Configuration de tout ce qui concerne les langues

Voila pour les news je vais essayer d’avancer un peu dessus si possible, au moins d’avoir une base clair est facile à reprendre / m’aider sur ce sujet.

1 « J'aime »

Merci pour vos réponses !
Félicitations à toi et désolé pour tes grasses mat :joy:

Ok j’attends pas de souci :wink:

@damalgos, à mon avis on le reverra pas avant longtemps, il est tombé sur un truc à programmer qui quoi qu’il fasses sera toujours bourré de bugs !!! Moi j’en suis à quinze ans de lignes de code et elle bugue régulièrement, curieusement beaucoup plus depuis 2/3 ans il parait que c’est l’adolescence programmée !! :rofl:

Sinon pour ceux que cela intéresse, je suis tombé sur cela, c’est récent et cela a l’air performant
https://hub.docker.com/r/alphacep/kaldi-vosk-server
https://hub.docker.com/r/alphacep/kaldi-fr

Créer sa propre reconnaissance vocale. Librairie python : vosk

Bon, je déterre ce sujet…
Z’avez vu ça ? https://www.electromaker.io/project/view/voicegpt
On ne saurait pas l’adapter à Gladys?

Hello. C’est basé sur Google Cloud Speech-to-Text API donc tout ce que tu dis va chez Google. Je ne pense pas que ce soit l’idée avec Gladys Assistant :neutral_face:

Je m’en rends bien compte mais… Compatibilité Google Home et OpenAI, on passe donc déjà par des serveurs externes pour certaines intégrations.
La reconnaissance pourrait ne se faire que lorsqu’un d’un déclencheur (bouton) est activé…
C’est l’idée du script (plutôt simple) que je mettais en évidence ici.

@GBoulvin le problème de ce genre de solution c’est le hardware, si tu veux avoir une reconnaissance qui marche bien il faut un hardware dédié à ça (multiple micros, un haut parleur pour les réponses + une raspberry pi ou autre), mis bout a bout, est ce que c’est réaliste (économiquement et fonctionnellement) d’avoir un montage beaucoup plus cher et moins performant qu’un Google Home / Amazon écho dot ?

Si c’est pour de toute façon utiliser l’API speech to text de google, pourquoi pas juste acheter un Google home a 29€ ?

2 « J'aime »