VASA-1, un générateur de « compagnons virtuels » bluffant de réalisme
Depuis plusieurs mois, des sociétés comme Elai ou Synthesia mettent à disposition des plateformes permettant de générer des avatars virtuels. Mais aucune de ces solutions n’avait, jusqu’ici, repoussé les frontières du réalisme comme le modèle de Microsoft. Capable de générer de générer des compagnons virtuels dotés « d’un large spectre de nuances faciales » et dont les mouvements de tête sont d’un réalisme saisissant, VASA-1 peut aussi synchroniser avec précision le mouvement des lèvres en fonction de la piste audio d’origine, et ce dans plusieurs langues. « [Le modèle] peut traiter des données audio de longueur arbitraire et produire de manière stable des vidéos de visages homogènes », complètent les chercheurs.
Pour des raisons éthiques, VASA-1 reste un projet interne de Microsoft
Alors que les préoccupations autour de l’IA ont été récemment ravivées par Sora, le générateur de vidéos conçu par OpenAI, c’est désormais Microsoft qui est entré prudemment dans la danse avec VASA-1. Toutefois, les objectifs des deux partenaires divergent. Si l’outil d’OpenAI, encore en phase de développement, semble être plus adapté à des utilisations artistiques, et pourrait être notamment exploité par l’industrie du cinéma, VASA-1 vise à créer des « avatars réalistes qui émulent les comportements conversationnels humains », afin de « renforcer l’équité en matière d’éducation, améliorer l’accessibilité pour les personnes ayant des difficultés de communication » ou encore « offrir un soutien thérapeutique à ceux qui en ont besoin », indique Microsoft.