Oana Goga : « Facebook n’est pas compétent pour déterminer si une publicité est politique ou non »

Rédigé par Félicien Vallet

28 janvier 2021

Dans un entretien avec LINC, la chercheuse en informatique Oana Goga présente les enjeux de la publicité politique en ligne en analysant le cas du réseau social Facebook. Oana Goga est lauréate du cinquième prix CNIL-Inria avec ses confrères Márcio Silva, Lucas Santos de Oliveira, Athanasios Andreou, Pedro Olmo Vaz de Melo et Fabricio Benevenuto pour leur article « Facebook Ads Monitor: An Independent Auditing System for Political Ads on Facebook ».

LINC : Vos travaux portent depuis plusieurs années sur le réseau social Facebook. Pouvez-vous les résumer brièvement et expliquer pourquoi vous vous intéressez à celui-ci ?

Tout d’abord, Facebook est la plateforme de publicité en ligne la plus populaire, avec plus de 2,5 milliards d’utilisateurs. Cela veut dire que cette plateforme permet à n’importe quel publicitaire de communiquer, ou d’envoyer son message, à une large part des citoyens connectés à Internet. C’est donc une plateforme de communication sponsorisée très puissante.

Le second point clef est que Facebook, qui est souvent précurseur dans les innovations concernant la publicité en ligne, offre aux publicitaires des techniques très avancées pour cibler leurs audiences. Ils peuvent en particulier sélectionner parmi plus de 250 000 attributs, dont beaucoup sont très spécifiques et parfois sensibles tels que « l’intérêt dans les mouvements anti-avortement » ou « la conscience du cancer ». Les publicitaires peuvent donc cibler des segments très précis de la population, et adapter les messages envoyés à ceux-ci.

Dans le passé, nous avons étudié la plateforme de publicité de Facebook sous plusieurs angles. A l’aide d’un outil de monitoring AdAnalyst que nous avons développé, nous avons d’abord analysé les mécanismes de transparence mis en avant par Facebook avec la fonctionnalité « Pourquoi je vois cette publicité ? » supposée expliquer aux utilisateurs pourquoi ils ont reçu une publicité donnée. Nos travaux ont montré que les explications données étaient loin d’être complètes. Sur l’aspect vie privée, nous avons regardé les sources des données que Facebook utilise pour le ciblage, en particulier les données collectées hors du monde en ligne que Facebook récupère grâce à des partenariats avec les data brokers (courtiers de données) comme Acxiom. Nos résultats ont montré que Facebook a apparié la plupart (90%) de ses utilisateurs aux Etats-Unis avec des données de data brokers, et que ces données peuvent être très sensibles (liées par exemple aux crédits contractés) mais très imprécises (dans 40% des cas). D’un point de vue sécurité, nous avons montré que l’on pouvait utiliser l’interface de gestion des publicités pour inférer les données personnelles des utilisateurs et dé-anonymiser les visiteurs d’un site web (ces failles ont bien-sûr été signalées à Facebook et réparées depuis).

Dans votre article, vous vous intéressez en particulier au cas des publicités politiques. Avant toute chose pouvez-vous préciser de quoi il est question ? Comment ces publicités sont-elles régies dans Facebook et en quoi diffèrent-elles des publicités politiques traditionnelles présentes dans les médias ?

Les publicités politiques sont envoyées de la même façon que les publicités de produits sur Facebook et ont accès aux mêmes options de ciblage. Le facteur principal qui rend la publicité politique sur Internet plus dangereuse, en comparaison avec les canaux classiques de publicité, est précisément cette capacité de ciblage. Nous avons tous entendu parler de Cambridge Analytica, cette entreprise de conseil en politique embauchée par Donald Trump et par le groupe leave.EU pour leurs campagnes. Cambridge Analytica est connue pour avoir utilisé du ciblage psychologique, c’est à dire envoyé des messages politiques particulièrement adaptés à la personnalité des récipiendaires. En 2016, les Etats-Unis ont aussi fait face à l’ingérence russe dans les élections, avec plusieurs campagnes de l’Internet Research Agency. Dans un précédent travail, nous avons étudié comment ces campagnes utilisaient les capacités de ciblage offertes par Facebook pour tenter de polariser les opinions des personnes ciblées.

Après les élections américaines de 2016, Facebook a mis en place plusieurs mécanismes de protection et de transparence pour les publicités politiques, en particulier la Political Ad Library. Il s’agit d’un dépôt central contenant les publicités politiques diffusées sur la plateforme et qui est publiquement accessible afin d’aider le public et les journalistes à scruter le discours politique. De leur côté, les gouvernements travaillent aussi sur le problème, et en particulier la Commission Européenne qui prépare le Digital Services Act (DSA) et le European Democracy Action Plan dans le but de réguler les plateformes et en particulier la publicité politique. Dans ce contexte, Věra Jourová, vice-présidente de la Commission Européenne chargée des Valeurs et de la Transparence, a affirmé dans une récente interview qu’il était envisagé de restreindre la capacité de ciblage pour les publicités politiques. Mais beaucoup de choses restent encore à définir précisément.

En l’espèce, pour mesurer la façon dont la publicité politique est opérée en ligne, vos co-auteurs et vous avez réalisé une expérimentation grandeur nature à l’occasion des élections présidentielles de 2018 au Brésil. Pouvez-vous nous décrire comment celle-ci s’est déroulée ?

La question principale que nous voulions étudier était de savoir si la Political Ad Library contient bien toutes les publicités politiques qui circulent sur la plateforme. A l’heure actuelle, tout publicitaire envoyant une publicité politique est tenu de déclarer sa publicité comme tel, et c’est simplement l’ensemble de ces publicités qui apparaissent dans la Political Ad Library. Mais nous ne savions pas si toutes les publicités politiques sont bien déclarées comme tel, si Facebook a mis en place des mécanismes de contrôles pour s’en assurer et le cas échéant, quel est leur efficacité. Il était donc impossible de savoir si la Political Ad Library contient bien toutes les publicités politiques ; et c’est fondamental puisque c’est la base de toute l’analyse du discours politique en ligne.

Nous avons donc utilisé notre plateforme d’audit indépendante, AdAnalyst, présentée plus haut. Celle-ci fonctionne grâce à l’aide des citoyens (volontaires) qui nous donnent accès aux publicités qu’ils reçoivent sur Facebook. Il s’agit d’une extension Chrome et Firefox que n’importe quel utilisateur peut installer. Notre objectif à l’époque était également de faire un monitoring des élections présidentielles au Brésil en 2018. Pour convaincre les utilisateurs d’installer AdAnalyst, mon collègue Fabricio Benevenuto a fait un travail de vulgarisation important, incluant une présentation au Sénat brésilien. Environ 2 000 utilisateurs ont installé AdAnalyst et nous avons collecté toutes les publicités (politiques ou non) qu’ils recevaient pendant la période électorale (240 000 au total).

Ensuite, à l’aide des données recueillies, nous avons implémenté des algorithmes d’apprentissage automatique pour détecter la publicité politique. Sans entrer dans les détails, ces algorithmes prennent en entrée des exemples de publicités politiques et non politiques et ils apprennent automatiquement à les distinguer avec peu d’erreurs : nos algorithmes ont détecté 85% de publicités politiques (sur notre jeu de données d’évaluation) avec seulement 1% de faux positifs (i.e., publicité non politique marquée comme politique).

Enfin, grâce à ces modèles, nous avons pu détecter les publicités politiques qui n’étaient pas déclarées comme telles dans notre jeu de données, c’est à dire qui n’apparaissaient pas dans la Political Ad Library. Nous avons découvert que 2% des publicités reçues par les utilisateurs étaient politiques mais non déclarées comme telles. Même si ce chiffre n’apparait pas énorme dans l’absolu, il est très important comparé aux 2 à 4% de publicités officiellement déclarées comme politiques et présentes dans la Political Ad Library.

A l’issue de la campagne électorale, quelles ont été les conclusions de votre étude ?

Notre étude a démontré que beaucoup des publicités politiques au Brésil pendant les élections présidentielles de 2018 n’étaient pas présentes dans la Political Ad Library. C’est très dommageable car c’est aujourd’hui le seul endroit où les journalistes, les organisations indépendantes (telles que les ONG), ou même le grand public, peuvent regarder pour faire un monitoring du discours politique.

Notre étude a aussi mis en évidence un autre problème. Les publicités politiques doivent être conformes à la législation électorale de leur pays. En particulier, la législation brésilienne prévoit que seuls les politiciens peuvent envoyer de la publicité politique dans la période électorale. Les données que nous avons collectées montrent que 20% des publicités non déclarées étaient en fait envoyées par des publicitaires qui n’avaient pas le droit d’envoyer de la publicité politique, comme des personnes physiques ou des organisations non gouvernementales. Ce résultat est intéressant parce qu’il soulève une question importante : Comment les Etats peuvent-ils faire respecter leurs législations s’ils n’ont pas accès à ces plateformes de publicité ?

La question de la régulation des contenus en ligne est actuellement très discutée et à travers différentes initiatives comme le Digital Services Act (DSA) cité plus haut l’Europe tend à se doter d’instruments de réglementation. Quelles modalités de contrôle faut-il mettre en œuvre selon vous ?

Sur la base de ces recherches, nous avons avons demandé que toutes les plateformes publicitaires rendent publique des Ad Libraries qui contiennent toutes les publicités et non seulement les publicités politiques. D’abord parce que Facebook n’est pas compétent pour offrir une archive de publicités politiques dont on peut garantir qu’elle est complète ; mais aussi parce que d’autres types de publicités peuvent être sensibles et d’importance publique (comme les publicités sur le covid-19 ou sur les vaccins par exemple).
Nous avons également détaillé les données qui sont nécessaires pour détecter la publicité politique malveillante. A l’heure actuelle, la Political Ad Library ne rend pas public les critères de ciblage utilisés par le publicitaire, ni aucune information sur l’efficacité (combien d’utilisateurs ont cliqué) ou l’impact (nombre de commentaires, de likes, etc.) des publicités politiques. Ces données sont essentielles pour détecter la publicité malveillante.

Toutes ces recommandations ont été détaillées dans une proposition intitulée “Universal ad transparency by default”, que j’ai co-écrite avec une trentaine de sociétés civiles et soumise à la Commission Européenne lors de la consultation pour le DSA. La première version (draft) de ce texte paru en Décembre 2020 semble aller dans ce sens, mais il faudra encore attendre pour que celui-ci soit finalisé.

Oana Goga

Publié le 28 janvier 2021

Oana Goga est chargée de recherches au CNRS dans l’équipe SLIDE du Laboratoire d'Informatique de Grenoble, depuis 2017. Elle était auparavant post-doctorante au Max Planck Institute for Software Systems aux côtés de Krishna Gummadi et elle a obtenu une thèse de doctorat de l’Université Pierre et Marie Curie en 2014. Ses recherches portent sur la sécurité et la vie privée dans les systèmes en ligne qui utilise des données personnelles. Elle a reçu un financement pour un projet ANR JCJC en 2017 et a été finaliste du 2019 Caspar Bowden PET Award for outstanding research in privacy enhancing technologies. En 2020, elle a reçu avec ses confrères un Honorable Mention Award à l’occasion de la Web Conference (WWW) puis le cinquième prix CNIL-Inria pour leur article « Facebook Ads Monitor: An Independent Auditing System for Political Ads on Facebook »

Image d'illustration : Photo : Félicien Vallet - Dreams by Jack Pierson)

Article rédigé par Félicien Vallet , Responsable IA de la CNIL

VOIR PLUS D'ARTICLES DE L'AUTEUR

Contenu annexe

Atelier de réflexion sur le RGPD dans la recherche scientifique

30 juillet 2025

Retour sur le Privacy Research Day 2025

29 juillet 2025

Les techniques d’Explainable AI [2/3]

07 juillet 2025