Média, publicité et navigateurs : quelle tendance pour le web ?
Rédigé par Martin Biéri
-
18 July 2023Alors que l’enjeu de protection des données et de la vie privée ne cesse de monter – en témoignent les annonces des grandes entreprises du numérique qui répondent aux sanctions régulières infligées par les autorités de protection des données – il est souvent opposé à celui du modèle économique d’Internet, qui repose en partie sur la publicité, notamment ciblée et consommatrice en données personnelles. Dans le même temps, les navigateurs proposent des paramétrages par défaut de plus en plus protecteurs de la vie privée des internautes. Petit tour d’horizon de la situation du côté des médias (et sites d’information) et des propositions d’un nouveau fonctionnement du web.
Un peu de contexte et présentation des acteurs
Les cookies ne font plus l’unanimité (depuis quelques années déjà)
En 2019, Google a annoncé ce que les médias ont repris comme « la fin des cookies ». Puisque ce mécanisme (dont l’historique et le fonctionnement sont décrits dans cet article) soulève des questions de vie privée – qui font l’objet d’une attention croissante des régulateurs (voir notre recommandation « Cookie et autres traceurs ») et que les autres fournisseurs de navigateurs ont déjà annoncé le blocage de ces outils de traçage –, Google s’est engagé dans un projet – ambitieux – de renouveler les modèles techniques de ciblage sans renoncer à la publicité ciblée (qui constitue plus de 80% de son propre chiffre d’affaires). Pour préserver ce modèle économique des sites (notamment ceux dont l’accès est libre), la firme américaine propose, via son projet de Privacy Sandbox, de nouvelles méthodes pour cibler la publicité en fonction des centres d’intérêt des utilisateurs, d’une manière qui se veut plus protectrice de la vie privée et des données des utilisateurs (voir par ailleurs la publication de la CNIL sur ce sujet).
En parallèle, les autres navigateurs ont fait des choix plus simples et plus radicaux sur cette question : depuis plus d’une décennie, Safari bloque par défaut les cookies tiers (ceux-là même qui permettent le traçage de l’internaute à des fins publicitaires) provenant des sites non visités par l’internaute. Constatant que certains sites parvenaient toujours à tracer les navigations à l’aides de subterfuges, Apple a dès 2017 développé un mécanisme de protection « Intelligent » pour mieux bloquer les cookies tiers utilisés pour le traçage. Aujourd’hui, des navigateurs comme Brave ou Firefox offrent des fonctionnalités similaires.
Cette évolution des navigateurs dans le but de « protéger » l’utilisateur n’est pas nouvelle : les protections contre les pop-ups (fenêtres intruses ou surgissantes selon Wikipédia) sont désormais présentes dans les paramètres des navigateurs, permettant de contrer cette mode qui a fleuri dans les années 2000. Et on retrouve encore des nouveaux paramétrages des navigateurs, plus ou moins cachés, qui s’attaquent à la publicité, comme en témoigne ce « flag » sur Edge pour Android qui permet de bloquer les publicités natives sur les vidéos YouTube. On peut s’interroger avec NextINpact sur la raison de ce choix : « L’explication pourrait être simplement que l’éditeur veut s’en prendre plus frontalement à Chrome, en proposant une fonction capable de drainer des utilisateurs ».
Navigateurs, publicité et parts de marché
Peut-on dire pour autant que les navigateurs sont anti-pub ? A priori, non. Par exemple, il n’existe pas de paramétrage pour bloquer la publicité de manière généralisée sur Firefox. Un des modèles proposés par Brave ne va d’ailleurs pas dans ce sens-là : il s’agit de remettre l’utilisateur dans la boucle de rétribution de la valeur générée par la publicité, pas de la supprimer de manière indifférenciée (voir la communication de l’entreprise sur son aspect « Récompenses » ou la récente communication sur les bandeaux-cookies, qu’il est désormais possible de bloquer). Ce qui tendrait vers un changement de modèle dans lequel le navigateur joue un rôle plus important.
Ainsi, les principaux navigateurs ont évolué sur la question des cookies, généralement pour s’aligner sur les standards de Safari (le LINC publiera bientôt une analyse de l’effectivité des mesures prises). Tous ? Non, car un navigateur irréductible repousse cette échéance : Chrome, alors même que Google a annoncé la fin prochaine des cookies. En effet, pour la firme américaine, qui est à la fois fournisseur d’un navigateur en position dominante en termes de part de marché et fournisseur de solutions de suivi et de publicité en ligne, il est nécessaire de trouver une solution qui préserve son modèle et celui de son écosystème fondé sur la publicité ciblée, avant l’implémentation de tels changements.
En effet, Chrome détient en France près de 60% du marché des navigateurs et cette position ne semble pas menacée. Toutefois, de leur côté, les éditeurs ont bien pris en compte le changement d’atmosphère lié au RGPD en installant récemment des « cookies walls » ou « paywalls » : soit l’utilisateur accepte de confier ses données pour accéder aux contenus, soit il peut s’abonner afin d’avoir un accès « libre » de publicités (voir la grille d’analyse de la CNIL sur le sujet). Ces murs viennent compléter ceux déjà mis en place par tous les sites qui demandent une inscription (et l’acceptation des conditions générales d’utilisation) pour être consultés : parmi les 20 marques les plus visitées en février 2023 en France, 9 demandent à l’utilisateur de se connecter, notamment les réseaux sociaux pour accéder à plus d’un contenu.
Ce qui profile un changement de paradigme dans le fonctionnement du web : il est désormais de plus en plus fréquemment possible de « payer l’accès » à travers le partage de ses données ou grâce à une microtransaction ou micropaiement, dont le tarif est fixé par l’éditeur au regard de la disposition à payer de l’usager ou du manque à gagner subi par l’éditeur du fait du refus du dépôt et suivi de cookie. Mais ceci a une certaine limite : si vous utilisez un navigateur avec des fortes protections par défaut, les cookies-tiers seront bloqués ou silotés. Et ce, même si vous acceptez le partage des données avec le site que vous consultez, soit parce que vous avez gardé les paramétrages par défaut – déjà protecteurs –, soit parce que vous avez-vous-mêmes choisi un paramétrage protecteur.
Ce pourrait être une nouvelle version du « paradoxe de la vie privée », mais cette fois version web, où l’on oppose d’un côté un Internet ouvert associé à un accès – apparemment – gratuit à l’information et de l’autre la protection de ses données. Et comme souvent pour ce genre d’opposition (de façade ?), il n’existe pas une solution unique et parfaite.
Quelles sont les alternatives actuelles ?
L’abonnement ou le péage
Tout le web ne repose pas sur la publicité et encore moins sur la publicité ciblée. Les modèles d’abonnement permettent également une rémunération des sites, et c’est notamment le cas de certains médias d’information, comme Mediapart ou NextINpact. Mais ce n’est pas sans difficultés : ce dernier en est l’exemple, comme ses équipes l’ont relaté dans un article intitulé « Next INpact est en réel danger de mort » en 2022, avant de faire de nouvelles annonces (et de faire les ajustements pour se maintenir), puis une (mauvaise) nouvelle annonce en 2023. Les modèles fondés sur les dons (à l’instar de Wikipédia par exemple) ne se retrouvent pas dans une activité « média » (notamment pour une problématique de viabilité et de projection : il est difficile de se projeter sur une base de dons).
La problématique est également le coût pour l’internaute, qui ne peut s’abonner à tout : c’est une des critiques récurrentes contre les services de vidéo à la demande et streaming que sont Netflix, Amazon Prime, Disney +, OCS, etc., ou encore pour suivre les différentes compétitions de football (RMC, BeIN Sports, Canal +, Amazon Prime, etc.). Sans compter les différents services numériques qui s’ajoutent : médias, sport, loisir, musique… L’addition peut s’avérer élevée voire inaccessible, surtout quand l’internaute paie déjà un abonnement pour accéder à Internet (via un smartphone ou une box). La récente annonce de la fin de La Presse Libre, un service d’abonnement unifié, qui n’a jamais dépassé le stade de la bêta, montre bien que ce système de « bouquet » abordable ne semble pas encore complètement viable. A noter toutefois l’initiative de Google « Suscribe with Google » (ou SWG), qui permet d’avoir des abonnements à des médias en ligne – comme Le Monde – à des tarifs préférentiels, dans un objectif d’augmenter les abonnements et les partenariats de l’entreprise avec les journaux en ligne.
Une étude a d’ailleurs été publiée en septembre 2022 sur cette question des cookie-walls et paywalls, afin de mesurer leur présence sur 2 800 sites en Europe centrale. Cette étude, intitulée « Your Consent Is Worth 75 Euros A Year – Measurement and Lawfulness of Cookie Paywalls » permet aussi de faire une première projection de ce que pourrait coûter à l’utilisateur le fait de s’abonner à tous les éditeurs qui proposent cette option, comme l’a fait le chercheur Wolfie Cristl : il faudrait débourser 728€ par an pour les 13 sites proposant le paywall.
La publicité contextuelle
Une autre solution serait de remplacer la publicité ciblée, celle qui génère un traçage, par de la publicité contextuelle classique : de la publicité qui est liée aux contenus proposés par le site ou à une certaine connaissance de l’audience de ce site, mais pas de l’internaute en particulier (comme proposer des articles de sport sur un média en ligne spécialisée dans cette thématique). Mais la publicité contextuelle est présentée comme moins précise et donc moins rémunératrice (puisqu’elle permettrait des taux d’engagement et de conversion moins élevés), là où la publicité ciblée est « indispensable » selon l’Interactive Advertising Bureau (IAB), association représentant les acteurs de la publicité en ligne. Toutefois, la publicité contextuelle, si elle implique moins d’intermédiaires, pourrait également restituer plus de valeur à l’éditeur. Un récent rapport pour la Commission européenne explique que les preuves empiriques manquent encore pour trancher définitivement ce point.
L’autre problématique est aussi que les annonceurs veulent avoir des métriques de performance (ce qui implique nécessairement d’analyser le contexte et donc des traceurs) : la publicité contextuelle sans ces indicateurs serait un retour en arrière pour les équipes marketing.
La publicité ciblée, un modèle aussi remis en cause
Dans un article de 2019, une équipe de chercheurs (Veronica Marotta, Vibhanshu Abhishek, et Alessandro Acquisti) avait – grâce à des données obtenues auprès d’une grande entreprise média (possédant plusieurs sites et des millions de transactions publicitaires) – estimé l’augmentation du revenu en passant par la publicité ciblée de 4%, soit seulement 0,00008 dollar par annonce. Les chercheurs proposent également de mettre ce montant en regard les coûts d’implémentation d’un système conforme (recueil du consentement, information, etc.). Et en 2021, une autre recherche questionnait par ailleurs la répartition des gains de la publicité ciblée, et donc ce modèle qui ne serait pas si vertueux : « Cependant, les affirmations selon lesquelles la publicité ciblée profite à tous les acteurs concernés n'ont pas été entièrement vérifiées dans la littérature » (traduction LINC). C’est par ailleurs la question posée par Tim Hwang dans son ouvrage « Subprime attention crisis: advertising and the time bomb at the heart of the internet » (ou Le grand krach de l'attention en français) : la problématique de n’avoir pas d’indicateurs fiables permettant de mesurer l’efficacité réelle de la publicité ciblée, dont l’écosystème est « trop opaque » selon lui.
Dans une série d’articles d’abord publiés sur De Correspondent aux Pays-Bas, les journalistes Jesse Frederiks et Maurits Martijn explorent les contradictions de ce marché. Pour les auteurs, le marché serait guidé par l’irrationalité plutôt que par les mathématiques. A titre de démonstration, ils citent cet exemple : « la pizzeria Luigi’s embauche trois adolescents pour distribuer des coupons aux passants. Après quelques semaines, l'un des trois se révèle être un génie du marketing. Les clients ne cessent de se présenter avec des coupons distribués par cet enfant en particulier. Les deux autres ne comprennent pas : comment fait-il ? Quand ils lui demandent, il explique : "Je les distribue dans le hall d’entrée de la pizzeria." » C’est d’abord de cette manière que fonctionne le marché de la publicité ciblée : celle-ci s’adresse en priorité à des personnes déjà convaincues voire déjà engagées dans l’acte d’achat, ce que les économistes appellent le « biais de sélection ». En ne poussant la publicité qu’à des personnes qui auraient de toute façon acheté, on ne convainc pas les personnes qui auraient été réellement incitées par la publicité (« advertising effect »).
Des biais de sélection au ROI biaisé
Ce biais de sélection a notamment été démontré par Steve Tadelis, professeur d’économie de l’Université de Berkeley, avec l’exemple d’eBay où il a passé un an entre 2011 et 2012. Pour ce faire, l’économiste a convaincu les équipes du marketing de supprimer les « Google Adwords » pendant trois mois afin de constater si les publicités du moteur de recherche avaient un quelconque effet. En fin de période, le trafic qui provenait auparavant de liens payants passait désormais par des liens ordinaires, non sponsorisés, alors que chaque année, eBay dépensait 20 millions de dollars sur les annonces ciblant le mot clé "eBay". Afin de valider l’expérience, il a effectué une deuxième vague de test, non plus avec le seul nom de la marque, mais avec des mots clés habituellement utilisés (« chaussures », « chemises », etc..). Alors que les services marketing anticipaient la catastrophe et une baisse des ventes de 5% au minimum, en trois mois, aucun effet à la baisse sur les ventes n’a été enregistré. L’économiste calculait au contraire une perte de 63 cents pour chaque dollar investi en publicité sur les moteurs de recherche. Les résultats auraient été les mêmes selon lui pour des bannières, des vidéos Instagram ou des publicités Facebook. La manière dont est calculée l’efficacité de la campagne est trompeuse : en ne distinguant pas le biais de sélection de l’advertising effect, et en ne poussant la publicité qu’à des personnes déjà convaincues, ils gonflent artificiellement les chiffres alors même que la rentabilité par euro ou dollar investi n’est pas très importante. Plus récemment, un autre témoignage inspiré de ce test-là est publié en avril 2022, intitulé « I stopped advertising everywhere and nothing happened. » (« J’ai stoppé la publicité partout et rien ne s’est passé »), dans lequel l’auteur relate une expérimentation similaire. En stoppant les publicités, notamment ciblées, rien n’a changé, car son entreprise était déjà bien implémentée et reconnue : ainsi, les gens cliquaient sur les liens sponsorisés (les premiers s’affichant) après avoir recherché le nom de l’entreprise sur Google…
Et des perspectives
Des nouveaux outils
Si l’on revient aux premiers propos de l’article, il était fait référence à l’annonce de Google de changer le web, notamment en éradiquant ce qui cause problème : le cookie (enfin, pas tous, mais le cookie-tiers). Google avait donc alors planifié cette fin pour 2022. Puis plutôt deuxième moitié de 2023. Puis peut-être finalement deuxième moitié de 2024. Que s’est-il passé durant ce laps de temps qui pourrait expliquer ce changement de date ?
D’abord, il y a eu FLoC. L’acronyme signifie Federated Learning of Cohorts, ou en français, apprentissage fédéré des cohortes. C’est l’une des briques proposées par Google dans sa Privacy Sandbox, la boîte à outils regroupant ses projets pour un web plus protecteur de la vie privée. L’idée de FLoC était de désindividualiser le suivi des personnes en les regroupant en cohortes ayant des goûts ou des profils similaires, fondés sur l’analyse de leur historique de navigation. Les individus partagent avec des milliers d’autres un identifiant de cohorte, qui s’actualise toutes les semaines. Google avait déployé l’outil pour qu’il soit testé dans plusieurs pays, mais l’initiative avait reçu un accueil mitigé, les critiques pointant notamment que FLoC ne répond qu’à une partie du problème de la protection des données et de la vie privée. En effet, il est toujours possible de croiser les données entre l’ID de cohorte et un univers authentifié (loggé), de même que les autres techniques de fingerprinting ne sont pas évacuées. Ce à quoi s’ajoutent de nouvelles questions : quid des données sensibles qui seraient exclues ? comment ? par qui ? selon quel seuil ? etc.
Enfin, les enjeux de concurrence ont poussé Google à travailler avec le régulateur anglais, la Competition and Markets Authority (CMA), qui décrivait en 2021 des risques de « distorsion du marché […] et possible abus de position dominante […] et self-preference ». En effet, quid de l’asymétrie d’information entre Google et ses concurrents ? Ou du fait que cette solution déplaçait le pouvoir (recueil du consentement et collecte des données) vers les navigateurs, dont Chrome est toujours le plus populaire ? Les autres navigateurs, qu’il s’agisse de Firefox, Brave, Edge ou encore Vivaldi, avaient alors ouvertement critiqué la solution… Amenant finalement à l’abandon de FLoC, remplacé par un autre outil : Topics. Ce dernier repose lui aussi sur votre navigateur : selon votre historique, des thématiques préférées sont choisies pour vous et renouvelées toutes les trois semaines. Seulement trois thématiques sont proposées, et sont gardées en local sur votre équipement (pas d’interactions avec les serveurs de Google), puis partagées avec les sites visitées (et leurs « partenaires publicitaires »). Il sera possible d’avoir un contrôle sur ces « topics » pour les modifier ou pour les désactiver.
Enfin, dans son annonce de report de cette « fin des cookies », on peut également voir une bonne raison : permettre d’allonger la durée de tests des outils et augmenter le nombre de retours.
A noter aussi que d’autres acteurs de l’écosystème planchent aussi sur la question : côté adtech, l’entreprise Critéo avait lancé en 2021 un concours pour trouver d’autres alternatives à ce que proposait Google. Ou côté navigateur, comme évoqué plus haut : le système de Brave, qui veut modifier le système pour que les utilisateurs y soient partie prenante.
Le web3 : retour vers le futur de la décentralisation (comme le web1, mais pas vraiment non plus)
L’avenir du web est un grand sujet de discussion actuel, avec l’avènement annoncé du web3, remplaçant de fait le paradigme actuel (logiquement, le web2). Si l’on revient sur ce que ces termes impliquent, il faut se replonger dans l’histoire d’internet, et l’avènement du « web1 » (ou plus simplement le web tel qu’il a émergé après la libération du code source de ce protocole par Tim Berners-Lee en 1993) : celui-ci représente les orientations prises dans les années 2000 d’un idéal centré sur le fait que chaque internaute aurait son propre espace d’expression, son propre journal en ligne, mais qui serait statique, immuable... et décentralisé.
Tout ceci fut bouleversé par l’avènement, à partir de la fin des années du « web 2.0 » (ou web2), opéré par de grandes plateformes qui hébergent du « contenu généré par les utilisateurs » (ou UGC – User Generated Content) comme YouTube. Cette évolution dynamise les contenus statiques du web au profit de contenus permettant des échanges asynchrones : c’est la création d’abord des blogs, avec ses commentaires et autres réponses. Et ceci jusqu’aux réseaux sociaux et tout ce qui constitue aujourd’hui les grandes plateformes d’échanges que nous connaissons : « Les conversations sont devenues des statuts, les commentaires des likes ». Les grandes plateformes du web que nous connaissons aujourd’hui prennent la main face aux éditeurs traditionnels : en se positionnant comme intermédiaires, elles collectent les données d’usage des internautes et monétisent « l’audience ». C’est donc le web que nous connaissons, celui des réseaux sociaux, mais aussi des projets collaboratifs comme Wikipédia. En parallèle du développement de nouvelles plateformes, le web 2.0 voit également émerger de nouveaux modèles économiques, fondés à la fois sur les effets de réseaux, la collecte de données et la publicité ciblée, notamment après le rachat de DoubleClick par Google en 2008. Les idéaux du « web1 » d’un environnement personnel et décentralisé disparaissent progressivement face à la puissance de ces nouveaux acteurs.
Les annonces de l’avènement du web3 n’ont fait que fleurir depuis quelques temps : que ce soit à travers les NFT, les cryptomonnaies et autres smart contracts, l’idée d’un web se défaisant de sa verticalité pour remettre les individus plus au centre et surtout plus « acteurs » de cet espace fait son chemin. Au cœur de cette « révolution », les chaînes de blocs (blockchain) permettraient une décentralisation transparente (par le principe même de la blockchain), mais aussi la suppression des intermédiaires. Ainsi, le web3 installe peu à peu l’idée d’une notion de propriété dans le fonctionnement du web, les créateurs devenant parties prenantes des plateformes de partage de créations. Cependant, tout ceci ne convainc pas tout le monde : certains s’interrogent sur son aspect marketing, d’autres sont encore assez sceptiques des promesses, en pointant certaines limites : il existe toujours des intermédiaires (les plateformes d’échanges de cryptomonnaies comme Binance ou Coinbase par exemple), la blockchain sera sur des serveurs et non pas sur les équipements des individus, ou encore le fait que l’émulation autour de ces nouveaux aspects est d’abord guidé par… l’argent et la spéculation.
Pour autant, si les défenseurs de ce web3 y voient bien un enrichissement des modèles économiques, notamment à travers la vente et la revente d’objets numériques, celui-ci ne semble pas forcément correspondre à tous les usages et à tous les éditeurs. Si les marques ou des individus peuvent se tourner vers la création, il n’en va pas de même pour un média par exemple. Sauf à voir dans une blockchain l’inscription de toutes les actions en ligne pour remplacer les cookies (voir par ailleurs la publication de la CNIL sur la blockchain) ? Une autre solution pourrait reposer sur des microtransactions de cryptomonnaies, à l’aide d’un porte-monnaie virtuel.
En tout état de cause, si les promesses et les cas d’usage du web3 sont souvent énumérés à l’infini par ses promoteurs, aucun modèle économique à grande échelle n’a encore émergé sur la base de ces briques technologiques, et la décentralisation du web pourrait reposer sur d’autres approches comme ActivityPub ou le « Edge computing » qui vient ces derniers mois contrebalancer l’informatique en nuage en raison du besoin croissant des individus et des entreprises de contrôler les données et leur traitement. Toutefois, ces protocoles, s’ils proposent des alternatives techniques intéressantes, ne justifieront pas en eux-mêmes un changement sur la distribution des revenus.
Si l’on se penche du côté des utilisateurs, certaines recherches de l’année 2022 semblent montrer que, petit à petit, le marché devraient orienter son angle d’approche pour mieux prendre en compte la vie privée des personnes : « 'Surprised, Shocked, Worried': User Reactions to Facebook Data Collection from Third Parties »[1] (Patricia Arias-Cabarcos et al., 2022) ou bien encore « “I feel invaded, annoyed, anxious and I may protect myself”: Individuals’ Feelings about Online Tracking and their Protective Behaviour across Gender and Country » [2] (Kovila P.L. Coopamootoo et al., 2022).
[1] « Surpris, choqué, inquiet » : Réactions des utilisateurs à la collecte de données par Facebook auprès de tiers
[2] "Je me sens envahi, agacé, angoissé et je peux me protéger" : Les sentiments des individus à propos du pistage en ligne et leur comportement de protection selon le sexe et le pays