Les ventriloques pourront-ils tromper DeepMind ?

Rédigé par Olivier Desbiey

30 November 2016

Après l'algorithme qui reconnait des visages là où les humains ne voient que des pixels, DeepMind l'intelligence artificielle développée par Google est désormais capable de lire sur nos lèvres.

Les résultats publiés conjointement par le Department of Engineering Science de l'Université d'Oxford et l'équipe du projet DeepMind indiquent que l'intelligence artificielle atteint un niveau de précision proche de 50%. C'est à dire qu'à partir d'un traitement de l'image issue d'une séquence vidéo (sans l'audio) elle est en moyenne capable d'annoter près d'un mot sur deux avec exactitude. Ce score est d'autant plus remarquable que confronté aux mêmes séquences vidéo, un professionnel de la lecture labiale (avec 10 ans d'expérience) n'a pas été en mesure de déchiffrer plus d'un quart des mots prononcés.

Pour parvenir à ce niveau de performance, DeepMind a été entrainé avec des milliers d'heures de programmes de la BBC.

Texte reference

Retrouvez l'article complet

Lip Reading Sentences in the Wild

Article rédigé par Olivier Desbiey , Chargé des études prospectives

VOIR PLUS D'ARTICLES DE L'AUTEUR

Contenu annexe

Le LINC

09 July 2026

[vidéo] Research@LINC : Réactions des personnes concernées à l’exercice de leur droit ...

30 June 2026

Taking inspiration from living organisms to store data: DNA, a "new" medium

10 June 2026