Voice Engine : le modèle de voix par IA d’OpenAI

OpenAI présente, dans son communiqué, les différentes possibilités d’application de son modèle, testées avec des partenaires :

  • L’aide à la lecture,
  • La traduction de contenu,
  • L’accompagnement des personnes muettes.

En langue française, il apparaît difficile d’évaluer les performances du modèle. En effet, OpenAI précise que les voix traduites conservent leur accent d’origine. Les références présentées étant toutes en anglais, le clonage en français s’habille donc invariablement d’un accent. En revanche, les exemples en langue anglaise démontrent des résultats remarquables, à tel point qu’il devient difficile de distinguer l’audio original de la voix clonée.

Pour limiter les risques associés au clonage de voix par IA, OpenAI a choisi de ne pas diffuser son modèle auprès du grand public. Seules quelques entreprises partenaires y ont accès, après s’être engagées à respecter les règles d’utilisation qui interdisent l’usurpation de l’identité d’une personne ou d’une organisation sans son consentement explicite.

Et scoop : Microsoft met la barre très haut pour les Avatars.

Partagez cet article