Les géants de la tech se nourrissent de la voix de leurs utilisateurs

Rédigé par Régis Chatellier

15 December 2016

Inutile d’articuler exagérément lorsque vous vous adressez à votre téléphone, les systèmes de reconnaissance vocale ne progresseront que si nous leur parlons naturellement.

Dans un article de Bloomberg, on apprend qu’Amazon, Apple, Microsoft et Baidu se sont lancés dans une chasse mondiale pour accumuler des térabits de voix humaine. Microsoft a installé des appartements témoins dans lesquels des volontaires simulent des conversations réelles. Au Brésil, il propose même à des joueurs de Xbox de conserver leur micro ouvert afin de capturer des voix dans un contexte bruyant. En Chine, Baidu cherche à collecter tous les dialectes locaux pour améliorer son service. Pourquoi une telle quête ?

Ici aussi, les données constituent le trésor de guerre. Les algorithmes de reconnaissance apprennent grâce aux réseaux de neurones artificiels et au deep learning, Andrew Ng (Baidu) explique que plus le système est alimenté en données, plus celui-ci progresse, d’où la course dans laquelle sont entrées ces grandes entreprises.

Cette accumulation de données tous azimuts n’est cependant pas toujours la seule solution pour éduquer les algorithmes, Google a d’ailleurs choisi une méthode moins gourmande en données, basée sur des dizaines de milliers de très courts extraits de voix (3 à 5 secondes) plutôt que sur de longs enregistrements. Du point de vue du respect de la vie privée, l’enregistrement permanent d’échantillons de voix reste très intrusif, même lorsqu’il s’agit de volontaires, et reste soumis à des règles précises, notamment liées au consentement, au droit d’accès, de modification et de suppression des données.

Texte reference

Lire l'article

[Bloomberg] Why Google, Microsoft and Amazon Love the Sound of Your Voice

Article rédigé par Régis Chatellier , Chargé des études prospectives

VOIR PLUS D'ARTICLES DE L'AUTEUR

Contenu annexe

Le LINC

09 July 2026

[vidéo] Research@LINC : Réactions des personnes concernées à l’exercice de leur droit ...

30 June 2026

Taking inspiration from living organisms to store data: DNA, a "new" medium

10 June 2026