Reconnaissance vocale Wit.ai


#1

Bonjour,

Ayant fait beaucoup de recherches sur la reconnaissance vocale et sur la domotique,
je suis tombé sur openjarvis, j’ai trouvé la reconnaissance vocale Wit.ai vraiment intéressante.
Et je suis récemment tombé sur votre projet, je le trouve très intéressent et novateur!
Le seul bémol pour moi c’est l’absence de reconnaissance vocale “gratuite”, car vous utilisez google speech.
J’aimerais savoir si vous planifiés de rajouter Wit.ai à la reconnaissance vocale, c’est vraiment puissant et il dispose d’une détection de mots clés adaptative sur leur site quand on crée un projet.
Un peu mieux que google et en gratuit en bref.

Bonne journée,
Scoubymat.


#2

Ça a l’air pas mal effectivement. Par contre c’est quoi leur business model?


#3

Bonne question… D’après leur site, ils ont une limite de 200 samples (morceaux audio pour le coup) posté sur la plate-forme par minutes. Je suppose qu’au delà, on doit les contacter et payer ^^

Après, ils ont été acheté par Facebook, donc bon… niveau sous, ça doit aller et Facebook y trouve son compte au passage également je pense :stuck_out_tongue:


#4

Je pense avoir cerné leur business model.

A mon avis, comme tout est gratuit, et que le système c’est d’apprendre à l’IA a reconnaître des mots clés des des phrases, comme ça a été racheté par Facebook.

Je pense qu’ils prévoient de sortir bientôt une AI style google home, et qu’ils se servent de la communauté pour apprendre leur IA a reconnaître les mots, types de phrases.

Concernant la limite des 200 mots, c’est une limite de requête par clée API, donc si chacun récupère sa propre clé devrais pas y avoir de problème.

Si par contre on veut utiliser la reconnaissance vocal, mais aussi leur système intelligent de reconnaissance des mots, bha va falloir les contacter pour augmenter la limite, et après faudra quelqu’un pour traiter les phrases sur se site de temps en temps.

Merci d’avoir lu mon long message, et je rappelle que ce que je dit sur leur business model c’est des suppositions.
@VonOx @Domnis


#5

Je ne suis pas sûr pour les 200 mots. Perso, je pense c’est plutôt 200 fichiers audios uploader par minute avec la même clef API. Mais oui, comme tu le dis, si chacun à sa clef API, la limite va être difficile à atteindre, sauf si on a 200 Gladys qui s’activent en même temps ^^ (mais on devrait être large :stuck_out_tongue: )


#6

Oui excuse moi je me suis mal exprimé ^^’ c’est ce que je voulais dire.

Mais du coup c’est comme l’API google mais en gratuit et moins compliqué :3
Faudrait voir si c’est possible à intégrer avec Gladys Voice.


#7

ça a été racheté par Facebook et je crois qu’ils allaient être shut down… Après en attendant on peut l’utiliser, pas sur que ça soit long terme^^


Snips : alternative à la reconnaissance vocale Google?
#8

Ah oui, si c’est prévu d’être shutdown… :confused:
Mais ça peut faire une solution de replis en attendant encore mieux et sans payer Google…
Mais faut pas que ça prenne trop de temps à mettre en place ^^


#9

@pierre-gilles Hey je revient vers vous, WIT.ai va toujours bien. Avez vous prévus du coup de l’implémenter pour la reconnaissance vocale à la place de google?
J’attend de pouvoir parler a Gladys avec impatience :slight_smile:


#10

Je ne sais pas si qq’un continue sur la voie wit, mais @Jean-Philippe fait des trucs qu’on l’air sympa sur snip. Check le forum.


#11

Salut,

Je confirme, j’ai quelque chose qui marche bien avec Snips, je manque juste de temps pour:

  • finaliser la PR que je dois faire au core de Gladys (pour ajouter la détection de la pièce d’ou vient la demande)
  • finaliser le module snips et le mettre dans le store

Ce qui sera utile en revanche, c’est qu’à la manière de Gladys, il faut alimenter Snips pour améliorer la reco qui se fait en local.
J’ai actuellement entrainé mon application Snips avec près de 200 phrases, mais il faudrait l’améliorer, si quelqu’un sait/peut créer un doc en ligne comme @pierre-gilles l’avait fait pour entrainer le brain, ca peut être sympa.

Sachant qu’une phrase peut/doit comporter des slots afin d’améliorer la reconnaissance.
J’ai créé les slots suivants:

  • deviceType
  • room
  • word
  • time
  • house
  • percentage

Je pensais aussi pousser une PR pour la reco du slot word, les autres étant déjà reconnus par Gladys, je les envoie qu’a titre d’information.
En revanche le slot word n’est pas reconnu, il permettrait par exemple de détecter des objets pour une liste de courses par exemple.
Pour cela, il faut justement entrainer snips sinon il ne reconnaitra pas des mots inconnus.

Une phrase doit ressembler à cela:

Allume la [lumière](deviceType) dans le [salon](room) à [80%](percentage) à [10 heures](time)

Va renvoyer la phrase avec les slots (entre () ) remplis par les mots (entre [])

ou bien

Ajoute du [pain](word) à la liste de course


#12

Sounds fckin’ great !


#13

Waw, ça à l’ai génial ! Tien nous informé de l’avancement :slight_smile: @Jean-Philippe


#14

Il a posté un message hier !!

ÉDIT : c’est avec snips, pas wip désolé…