Les géants de la tech se nourrissent de la voix de leurs utilisateurs

Rédigé par Régis Chatellier

 - 

15 décembre 2016


Inutile d’articuler exagérément lorsque vous vous adressez à votre téléphone, les systèmes de reconnaissance vocale ne progresseront que si nous leur parlons naturellement.

Dans un article de Bloomberg, on apprend qu’Amazon, Apple, Microsoft et Baidu se sont lancés dans une chasse mondiale pour accumuler des térabits de voix humaine. Microsoft a installé des appartements témoins dans lesquels des volontaires simulent des conversations réelles. Au Brésil, il propose même à des joueurs de Xbox de conserver leur micro ouvert afin de capturer des voix dans un contexte bruyant. En Chine, Baidu cherche à collecter tous les dialectes locaux pour améliorer son service. Pourquoi une telle quête ?


Ici aussi, les données constituent le trésor de guerre. Les algorithmes de reconnaissance apprennent grâce aux réseaux de neurones artificiels et au deep learning, Andrew Ng (Baidu) explique que plus le système est alimenté en données, plus celui-ci progresse, d’où  la course dans laquelle sont entrées ces grandes entreprises.

Cette accumulation de données tous azimuts n’est cependant pas toujours la seule solution pour éduquer les algorithmes, Google a d’ailleurs choisi une méthode moins gourmande en données, basée sur des dizaines de milliers de très courts extraits de voix (3 à 5 secondes) plutôt que sur de longs enregistrements. Du point de vue du respect de la vie privée, l’enregistrement permanent d’échantillons de voix reste très intrusif, même lorsqu’il s’agit de volontaires, et reste soumis à des règles précises, notamment liées au consentement, au droit d’accès, de modification et de suppression des données.

 


Article rédigé par Régis Chatellier , Chargé des études prospectives