Les ventriloques pourront-ils tromper DeepMind ?

Rédigé par Olivier Desbiey

 - 

30 novembre 2016


Après l'algorithme qui reconnait des visages là où les humains ne voient que des pixels, DeepMind l'intelligence artificielle développée par Google est désormais capable de lire sur nos lèvres.

Les résultats publiés conjointement par le Department of Engineering Science de l'Université d'Oxford et l'équipe du projet DeepMind indiquent que l'intelligence artificielle atteint un niveau de précision proche de 50%. C'est à dire qu'à partir d'un traitement de l'image issue d'une séquence vidéo (sans l'audio) elle est en moyenne capable d'annoter près d'un mot sur deux avec exactitude. Ce score est d'autant plus remarquable que confronté aux mêmes séquences vidéo, un professionnel de la lecture labiale (avec 10 ans d'expérience) n'a pas été en mesure de déchiffrer plus d'un quart des mots prononcés.

Pour parvenir à ce niveau de performance, DeepMind a été entrainé avec des milliers d'heures de programmes de la BBC.

Texte reference

Retrouvez l'article complet


Article rédigé par Olivier Desbiey , Chargé des études prospectives