Les droits de la voix (2/2) - Quelle parole pour nos systèmes ?

Rédigé par Félicien Vallet

 - 

27 juin 2019


Alors que nous donnons chaque jour de la voix auprès de nos interfaces, il est essentiel de faire un état des lieux des problématiques juridiques entourant le traitement de ces données éminemment personnelles. Suite à la publication de notre premier article, voici le second consacré à la question.

Comme cela a été exposé par Nicolas Obin dans l’interview qu’il nous a donnée, le traitement de la voix à l’heure de la synthèse vocale pose de nombreuses questions au regard du droit. Si, dans bien des cas, les applications envisagées sont tout à fait pertinentes, l’utilisation de caractéristiques vocales propres à une personne pose néanmoins des questions relatives notamment à l’usurpation d’identité et à la manipulation.

 

Attention aux imitations

Dans notre précédent article, nous pointions l’existence du « droit à la voix », équivalent sonore au droit à l’image. Si le droit à la voix couvre les aspects relatifs à la diffusion de propos tenus dans une sphère privée, un autre aspect de ce droit concerne « l’identité vocale ».

En 1975, un jugement a sanctionné l’utilisation d’un spot publicitaire télévisé reposant sur un texte lu par une personne dont « la diction, le débit, le ton et les inflexions de voix [...] évoquaient les particularités verbales du comédien Claude Piéplu (la voix des Shadoks) ». Claude Piéplu demandait des dommages et intérêts et a obtenu gain de cause auprès du Tribunal de grande instance, ce dernier exposant que toute personne est en droit d'interdire que l'on imite sa voix dans des conditions susceptibles de créer chez l'auditeur une « confusion d'apparence » (voir référence ici). A l’étranger, et en particulier aux États-Unis, la jurisprudence fait état de cas similaires, par exemple pour les chanteurs Tom Waits et Bette Midler.
Concernant l’imitation, on considère en pratique (du moins en France) que le recours à un sosie porte atteinte au droit à l’image et/ou à la voix de la personne concernée. Il existe toutefois des exceptions, si l’imitation :

  • est justifié par le contexte historique ou d’actualité dans lequel est située l'œuvre ;
  • n'est pas de caractère diffamatoire ;
  • présente un caractère de parodie ou de caricature.

 

Un attribut protégé par la propriété intellectuelle

Si le droit d’auteur protège les œuvres littéraires, les créations musicales, graphiques et plastiques, les logiciels, les créations de mode, etc., les artistes-interprètes, les producteurs de vidéogrammes et de phonogrammes, et les entreprises de communication audiovisuelle sont eux protégés par des droits voisins du droit d’auteur. Les dispositions propres au droit d’auteur et à ses droits voisins sont régies par le livre deuxième du Code de la propriété intellectuelle (respectivement les articles L.111-1 et suivants et L.211-1 et suivants).

Les artistes de doublage sont des professionnels qui se voient reconnaître le statut d'artiste-interprète. Concrètement, le doublage permet de substituer aux dialogues originaux des dialogues dans une autre langue. Les artistes de doublage interprètent donc vocalement un rôle en tentant de rendre toute la crédibilité du personnage d'origine. S'agissant d'une interprétation, on peut donc se poser la question du droit voisin de ces artistes de doublage. En effet, le Code de la propriété intellectuelle reconnaît un droit de propriété littéraire et artistique à l’interprète qu'il définit comme une personne « qui représente, chante, récite, déclame, joue ou exécute de toute autre manière une œuvre littéraire ou artistique, un numéro de variété, de cirque ou de marionnettes » (L.212-1). En pratique, les droits voisins protègent donc l’interprétation d’une « œuvre de l’esprit » par un artiste-interprète.

Si dans certains domaines le statut d'artiste-interprète semble relativement aisé à faire reconnaître, dans d’autres, comme par exemple celui de la publicité, cela n’est pas si évident. Ainsi, en 1995, un artiste a prêté son concours à l'enregistrement de sa voix afin d'intégrer le slogan publicitaire de la marque Uncle Ben's « c'est toujours un succès » à un spot télévisé en doublant le personnage apparaissant à l'écran. Réclamant des suppléments de rémunération au titre de l'utilisation de sa voix et revendiquant un droit d'artiste-interprète, le comédien a saisi le conseil de prud'hommes, qui l'a débouté de toutes ses demandes. Dans un arrêt rendu le 9 octobre 2008, la cour d'appel de Versailles a infirmé le jugement du conseil de prud'hommes sur la question de la rémunération. Elle a cependant rejeté la qualité d'artiste-interprète au comédien et retenu celle d'artiste de complément, retenant notamment que celui-ci , « quelle que soit son expérience de comédien, était inconnu du grand public et qu'il ne peut, dès lors, se prévaloir d'une notoriété telle qu'elle lui conférerait, indépendamment des caractéristiques de sa prestation, le statut d'artiste-interprète ».

Le statut d’artiste de complément est donc un autre statut qui peut être reconnu aux personnes voyant leurs voix exploitées à l’occasion d’un enregistrement. Toutefois, à l’inverse de l'artiste-interprète, celui-ci n'a pas de droit voisin, ce qui peut impliquer une différence financière : alors que le premier a droit à une rémunération en principe proportionnelle aux recettes d'exploitation de l’œuvre, l'artiste de complément n'est payé que de manière forfaitaire. Ainsi, si nous indiquions dans notre précédent article que le droit à la voix est un droit de la personnalité et est par conséquent extrapatrimonial, l’exploitation commerciale de celle-ci peut revêtir un caractère pécuniaire (et donc patrimonial).

 

Demain, tous interprètes ?

Toutefois l’évolution des technologies du numérique et l’émergence de nouveaux usages questionne la façon dont le droit trouve désormais à s’appliquer. À cet égard, le cas de Cyril Mazzotti est illustratif. Ce comédien français s’est aperçu fortuitement que sa voix avait servi de modèle pour créer celle de Siri, l'assistant vocal d’Apple pour les iPhones de systèmes d'exploitation iOS 5 et iOS 6, premier assistant vocal déployé sur des appareils grand public. Il s'avère que Cyril Mazzoti avait prêté sa voix à la société Nuance Communications, un des acteurs majeurs du domaine du traitement de la parole, afin d'enregistrer des messages destinés à être exploités dans des systèmes de téléphonie. Plus précisément, il s'agissait de constituer une bibliothèque de tous les phonèmes existants en français, chose effectuée en lisant plusieurs dizaines de milliers de mots. Le fait de disposer de réalisations acoustiques pour chaque phonème a permis de mettre en œuvre un système de synthèse vocale par concaténation, c'est-à-dire procédant de la reconstruction artificielle d'une énonciation par la mise bout-à-bout de petites tranches de signal audio. Cyril Mazzotti ainsi que d'autres voix de Siri – en particulier Susan Bennett et Jon Briggs pour les versions en langue anglaise – ne se sont rendu compte de l’utilisation de leur voix que quelques années plus tard, Nuance Communications ayant agi comme sous-traitant. La participation à l’identité vocale d’un assistant déployé présents dans les appareils de millions de consommateurs n’étant pas anodine, Apple a par la suite modifié les conditions de rémunération.

Dans le cas des personnes fournissant leur voix pour la synthèse de parole, on peut toutefois se demander si celles-ci ne peuvent pas être considérées comme des assistants à la création et ainsi relever du statut d'artiste-interprète ou d’artiste de complément. Dans un contexte où de nombreuses start-ups, telles que Lyrebird, Oben, VoxyGen, CandyVoice, ou encore Acapela proposent désormais de créer son propre avatar vocal, la question se pose donc de savoir si nous ne serons pas demain tous interprètes ! Enfin, si aujourd’hui la qualité des clones vocaux produits ne semble pas encore parfaitement satisfaisante (comme en témoigne une publication scientifique récente), les nouvelles possibilités offertes par la synthèse de parole renouvellent les questions relatives à la fraude et à l’usurpation d’identité. Ces sujets, qui tenaient il y a encore peu du domaine de la science-fiction, concentrent désormais de plus en plus d’initiatives. Ainsi, le challenge scientifique ASVSpoof s’intéresse à l’amélioration des mécanismes pour leur détection. Outre la gestion des simples « rejeux » (diffusion d’un enregistrement de voix pris à l’insu d’une personne), il s’agit désormais de contrer des modalités de piratage toujours plus élaborées, comme celles reposant sur l’utilisation de GANs (réseaux de neurones adversaires) par exemple.

 

Vox post mortem

Dans un futur proche, se poseront sûrement également des questions relatives à la mort numérique et aux usages post-mortem de nos voix. De telles utilisations, qui relevaient encore du domaine de la science-fiction il y a peu (voir l’épisode Be Right Back de la série Black Mirror), sont désormais explorées par certaines entreprises comme la start-up Replika – qui n’utilise pas à ce jour de données de voix. Au Japon, la reproduction des gestes ainsi que des traits physiques et vocaux d’un défunt est déjà à l’œuvre dans un projet artistique visant à accompagner le travail de deuil dans la tradition bouddhiste, suite au décès d’une personne chère. Sachant qu’il est actuellement question de doter de plus en plus nos objets de capacités d’écoute et de parole, ne peut-on pas imaginer que des objets du quotidien s’expriment avec les voix de proches disparus ? Une cafetière pourrait ainsi se mettre à parler à la façon d’une arrière-grand-mère alors que l’aspirateur aurait le timbre nasillard et fort reconnaissable d’un oncle récemment disparu ?

La loi pour une République Numérique a consacré en 2016 la notion de mort numérique et entraîné la modification de la Loi Informatique et Libertés via l’insertion de l’article 40-1. Toutefois, il apparaît que les données dont il est question concernent en premier lieu la gestion de comptes en ligne. Il s’agit en effet de permettre aux proches d’un défunt d’exercer les directives prévues par celui-ci relativement à la conservation, à l’effacement et à la communication des données après son décès ou, dans le cas où aucune directive n’aurait été donnée, de clôturer les comptes utilisateurs et de s’opposer au traitement ultérieur des données. Toutefois, quid de l’utilisation post-mortem des données de voix ? Le « droit à la voix » pourrait se voir à nouveau mobilisé dans le cas d’une utilisation faite après le décès de son auteur. En effet, des jurisprudences devenues célèbres permettent de poursuivre les auteurs de diffamations et injures faites aux défunts (article 29 de la Loi du 29 juillet 1881 sur la liberté de la presse) ainsi que de publications de l’image d’une personne décédée (article 9 du Code Civil).

 

Conclusion

Cet article et le précédent, nous ont permis de réaliser un rapide tour d’horizon des questions juridiques posées par le traitement de la voix, tant au niveau de l’analyse des signaux de parole que de leur synthèse. A l’heure où, comme l’indique l’étude Hadopi-CSA sur les assistants vocaux et les enceintes connectées, les technologies de la parole sont appelées à prendre une importance toujours grandissante dans les vies de leurs utilisateurs, il apparaît toutefois que bien peu d’entre eux sont conscients des droits auxquels leurs voix sont attachées. Une étude récente a ainsi montré que 82% des Français ignoraient que leur voix était une donnée à caractère personnel protégée par le Règlement Général sur la Protection des Données (RGPD).

Par conséquent, si des textes, dispositions et jurisprudences issus de divers pans de la réglementation existent et peuvent être mobilisés, les nouveaux usages de nos voix par les technologies numériques nécessiteront très certainement un ajustement. Mais n’est-ce pas le rôle du droit que de s’adapter aux évolutions de la société ?



Article rédigé par Félicien Vallet , Responsable IA de la CNIL