Google, Alexa, Siri… Les assistants vocaux des plus grandes entreprises de la tech se positionnent comme les ambassadeurs du marché. Dans une telle configuration, il est difficile pour tout nouvel acteur de trouver sa place. Sauf si ce dernier s’engage à un traitement plus éthique de la voix, des données collectées et se donne pour mission de favoriser l’accessibilité.

C’est ce que propose Mozilla, avec son projet Common Voice et sa technologie Deep Speech.

En marge de la Digital Tech Conference de ce 30 novembre à Rennes, nous avons interrogé Kelly Davis, chercheur en machine learning chez Mozilla, pour en savoir plus sur les projet du groupe.

Pouvez-vous nous expliquer les projets de Deep Speech et Common Voice et Mozilla ? Quels sont les enjeux et les objectifs ?

La technologie de reconnaissance vocale révolutionne la manière dont nous interagissons avec les machines. Mais pour le moment, l’accès à cette technologie est coûteux et ne comprend pas un ensemble diversifié d’accents et de langues. Seule une poignée d’entreprises contrôle l’accès à toutes les fonctions de reconnaissance vocale. Deep Speech et Common Voice sont deux projets complémentaires par lesquels Mozilla souhaite modifier cet état de fait.

Quels sont selon vous les opportunités et les obstacles de cette tendance ?

Les opportunités sont immenses. La démocratisation de la technologie vocale ne réduira pas seulement la barrière de l’innovation mondiale, mais également la barrière de l’accès à l’information. Cela est particulièrement vrai pour les personnes qui ont traditionnellement eu moins de cet accès – par exemple, les malvoyants, les personnes qui n’ont jamais appris à lire, les enfants, les personnes âgées et bien d’autres.


Repéré depuis https://www.blogdumoderateur.com/common-voice-mozilla-reconnaissance-vocale/

Partagez cet article