Al(t)gorithmes (2) : Perceptions des utilisateurs de streaming
Rédigé par Octave Aribaud
-
12 décembre 2022L’apparition du streaming a transformé la manière dont on calcule l’audience ainsi que la perception des utilisateurs. Alors que les utilisateurs ont longtemps été caractérisés au prisme de la dichotomie utilisateur passif/actif, les recherches sur la personnalisation ont poussé à concevoir des utilisateurs « pluriels » qui évoluent en fonction de leurs contextes (environnement, état émotionnel…). Ces différentes catégories ont un impact sur la conception des algorithmes et des incidences sur les individus eux-mêmes.
- Article 1 : Al(t)gorithmes (1) : des recommandations toujours plus gourmandes en données personnelles ?
- Article 2 : Al(t)gorithmes (2) : Perceptions des utilisateurs de streaming
- Article 3 : Al(t)gorithmes (3) : Streaming, des algorithmes pas toujours responsables
- Article 4 : Al(t)gorithmes (4) : Musiconomics et protection des données personnelles
Le 27 mai 2022, de nombreux médias s’emballaient après la sortie de la quatrième saison de Stranger Things sur Netflix et le record historique d’audience pour une série anglophone, près de 287 millions d’heures de visionnage le seul week-end de sortie. A la sortie des premiers épisodes de la série Le Seigneur des Anneaux : les Anneaux du Pouvoir, Amazon Prime diffusait aussi, pour la première fois de son histoire, des données d’audience.
La mesure de l’audience n’a rien de nouveau puisqu’elle est calculée depuis les années 1950 environ. Néanmoins, comme l’indique R. Chaniac, à cette époque, le nombre de spectateurs de la télévision n’était pas assez important pour justifier l’installation d’un système coûteux. Le développement spectaculaire de la télévision au cours des années 1960 va engendrer la création d’outils de mesure plus précis. En 1967 nait le « panel postal » qui permet de mesurer l’audience d’un panel représentatif de la population via une sorte de sondage. Il faut cependant attendre 1982, date de l’apparition de l’audimètre en France, pour connaître l’automatisation de la mesure d’audience qui sera désormais plus fiable et plus précise. L‘avènement de la technologie streaming permet aujourd’hui aux plateformes de comptabiliser très facilement chaque écoute ou visualisation. Aujourd’hui, la mesure systématique de l’audience témoigne de l’importance que l’industrie du divertissement porte à ces indicateurs et permet de constater que nous passons de plus en plus de temps à consommer du contenu. Ainsi, pendant le premier confinement, aux Etats-Unis, les utilisateurs de Netflix passaient près de 3.2 heures par jour à consommer du contenu. Dans cet article, il s’agira d’étudier les moyens mis en place par les plateformes de streaming pour comprendre les comportements utilisateurs et les stratégies qu’elles mettent en œuvre pour s’y adapter.
Peut-on caractériser l’auditeur sous le prisme de la dichotomie actif ou passif ?
Comme l’affirme J.S. Beuscart et S. Coavoux dans un article datant de 2019 : « en matière d’agentivité, les plateformes de streaming se situent à mi-chemin entre la collection de disques et la radio ». L’écoute d’un disque est une écoute que l’on peut caractériser comme active, et en effet, « on choisit deux fois un disque », lors de son achat et lors de son écoute (A. Hennion, S. Maisonneuve & E. Gomart, Figures de l’amateur. Formes, objets, pratiques de l’amour de la musique aujourd’hui, 2000). A l’inverse, l’écoute de musique à la radio est souvent dite passive, car on ne choisit pas la musique qui est diffusée. Pour caractériser l’écoute de l’auditeur de streaming, il peut être intéressant de l’étudier sous le même prisme actif/passif.
La construction du mythe de l’individu passif…
Sur les plateformes de streaming, et à la manière des humains présentés dans le film d’animation WALL-E, les utilisateurs sont souvent dépeints comme des individus passifs, guidés par des algorithmes de recommandation, qui n’auraient que peu d’autonomie quant à la manière de naviguer sur les plateformes de streaming. A ce titre, le terme de « consommateur » – en opposition à « acteur » – traduit plutôt bien la passivité qui désigne souvent les utilisateurs de streaming. Cette image renvoie en fait à la perception que les plateformes de streaming ont de leurs utilisateurs. C’est ce qu’explique Nick Seaver dans un article intitulé « Captivating algorithms: Recommender systems as traps », publié en 2018. Selon lui, les plateformes de streaming auraient adopté un « paradigme de la captivation qui en vient à considérer les utilisateurs comme des proies (donc passives) qu’il faudrait capturer ». Cette manière de percevoir les consommateurs prend sa source dans les travaux de F.B. Skinner à Harvard dans les années 70 et notamment dans son ouvrage Par-delà la liberté et la dignité dans lequel il imagine une technologie du comportement invasive – l’ingénierie comportementale – visant à modifier les comportements d’une population. Cela donne bientôt naissance à la captologie, qui considère que les individus ont des biais et des impulsions qui les rendent sensibles à la persuasion et les transforment en proies à capturer. Par exemple, et comme nous l’évoquions dans le cahier IP6, La Forme des choix, Nir Eyal dans son best-seller Hooked : How to build habit forming products (2014) esquisse un paradigme pour la conception de logiciels : les entreprises qui veulent acquérir des utilisateurs doivent leur inculquer des habitudes. Pour atteindre cet objectif, il faut penser aux utilisateurs non pas comme des clients choisissant parmi diverses curiosités, mais comme des esprits instinctifs. Quand N. Seaver discute avec le chef scientifique d’une de ces plateformes de streaming, celui-ci répond que l’ambition des algorithmes est avant tout de fasciner l’auditeur de musique afin qu’il y passe le plus de temps possible.
Le design joue aujourd’hui un rôle fondamental dans la conception d’objets numériques visant à retenir au maximum l’attention des utilisateurs. A ce titre, le patron de Netflix déclarait en 2017 que le plus grand rival de la plateforme était désormais le temps de sommeil des utilisateurs. Pour faire face à ces pratiques visant à piéger les utilisateurs, nombreux sont ceux qui ont commencé à militer pour un design plus responsable. Chez Spotify par exemple, certains designers comme Lu Han ou Kat Zhou ont mis en avant l’importance d’un design éthique. En 2019, la CNIL a lancé son site internet Données et Design, à la suite du Cahier IP 6 : La Forme des Choix, qui met en avant l’importance de travail de conception des interfaces numériques. Données et Design souligne notamment l’action des designers pour permettre aux utilisateurs une meilleure maîtrise de leurs données au prisme de trois concepts clefs que sont l’information, le consentement et l’exercice des droits.
Mesurer la captivité des utilisateurs
On retrouve aussi l’influence de cette vision du consommateur captivé dans la manière d’évaluer les recommandations des utilisateurs. Dans les années 1990, la pertinence des systèmes est évaluée sur leur aptitude à prédire une partie des notes passées des utilisateurs, par exemple les films précédemment évalués par un individu sur une plateforme telle que IMDB. La mesure standard de cette prédiction est l’erreur quadratique moyenne, qui prédit la façon dont les utilisateurs évaluent les éléments et jugent les prédictions en fonction de leur précision. Progressivement, les plateformes se tournent vers des métriques centrées sur l’utilisateur, que Seaver nomme « métriques de captivation », par exemple le temps passé à écouter le titre, la durée de la session d’écoute… Alors que le regroupement de ces métriques porte le nom d’« user satisfaction », Seaver note que l’ambiguïté de ce terme satisfait les firmes tout en neutralisant les inquiétudes des ingénieurs soucieux du bien-être des utilisateurs : si les utilisateurs restent, c’est qu’ils sont heureux.
… cache que l’utilisateur de streaming est en réalité plutôt actif !
Dans les faits, les utilisateurs de musique en streaming sont plutôt actifs. Dans leurs travaux de 2019, J-S. Beuscart, S. Coavoux et S. Maillard analysent un échantillon représentatif afin de qualifier les pratiques de l’auditeur moyen. Les auteurs concluent à la figure de l’auditeur autonome. En effet, 58.7% des morceaux sont écoutés à partir de la bibliothèque personnelle de l’usager. A ces écoutes qu’ils nomment « stock » s’ajoutent 16.5% d’écoutes dites « autonomes », qui sont initiées par l’auditeur mais guidées par des algorithmes de recommandation (par exemple l’écoute du top de l’artiste ou via la barre de recherche). L’audition passive sur les plateformes de streaming est assez faible puisque les recommandations algorithmiques accompagnent seulement près de 13% des écoutes, un peu plus seulement que les recommandations traditionnelles (recommandation par les pairs, journaux spécialisés…). Cette étude tend à montrer que les auditeurs de streaming sont ainsi d’avantage actifs que passifs.
A cela s’ajoute, que les utilisateurs de streaming jouent avec les algorithmes de recommandation des différentes plateformes pour optimiser leur consommation et leur quête de découverte. Lors d’un premier travail exploratoire, différents entretiens ont été menés avec des utilisateurs de Spotify, permettant d’observer que ces derniers construisent des stratégies pour optimiser leur session d’écoute. D’abord, les auditeurs s’approprient les outils qui correspondent le mieux à leurs objectifs. Par exemple, un utilisateur souhaitant découvrir les dernières sorties musicales, utilisera d’avantage la playlist « Radar des sorties » – une sélection hebdomadaire des dernières sorties selon ses goûts – que d’autres propositions curatoriales… Parfois, c’est la déception vis-vis de certains outils qui pousse les utilisateurs à préférer certaines suggestions algorithmiques à d’autres. Une utilisatrice confiait par exemple qu’elle avait été déçue plusieurs semaines de suite par les recommandations effectuées sur la playlist « Découverte de la Semaine ». Décrite comme le summum de la recommandation sur Spotify, cette playlist personnalisée envoyée chaque lundi a été conçu pour aider les utilisateurs à faire des découvertes – et que, pour cette raison, elle préférait désormais plus régulièrement ses « Daily Mix » – listes de lectures renouvelées quotidiennement et construites en majorité à partir des titres déjà likées par les utilisateurs.
Il faut plutôt appréhender l’individu comme un pluriel
Alors que la dichotomie entre auditeur actif et auditeur passif peut faire débat, il peut être intéressant de s’écarter de ce prisme d’étude pour analyser les perceptions que les machines ont de l’individu. Dans son article « Nothing personal: algorithmic individuation on music streaming platforms » publié en 2018, R. Prey commence par citer l’écrivain R.Williams : «… there are in fact no masses, but only ways of seeing people as masses » (« il n'y a en fait pas de masses, mais seulement des façons de voir les gens comme des masses » in Keywords: A Vocabulary of Culture and Society, 1976). A l’âge de la personnalisation, le mot « masse » semble être un anachronisme. Prey, reprend le raisonnement de Williams pour l’appliquer aux streaming, et conclut qu’il n’existe pas réellement d’individus, seulement des manières de représenter les utilisateurs comme des individus. Il en fait la démonstration en observant comment les plateformes de streaming construisent la figure de l’individu. Pandora, une plateforme de streaming musicale populaire aux Etats Unis est particulièrement connue pour ses recommandations basées sur le « Music Genome project ». Ce système classifie les musiques en extrayant près de 450 « gènes » musicaux : quand un auditeur écoute une musique, Pandora lui propose des musiques aux « gènes » similaires. L’auditeur a alors la possibilité d’aimer ou de ne pas aimer la proposition pour affiner ses préférences, et ainsi donner plus ou moins d’importance à certains gènes. En décidant d’opter pour un tel système de recommandation, Pandora décide de séparer le goût de l’influence culturelle. Les musiques recommandées à l’utilisateur ne sont pas les titres populaires dans son pays mais elles sont sélectionnées en tenant compte de ses goûts personnels. Pandora offre ainsi à l’utilisateur la possibilité de se libérer de l’influence homogène des masses et préciser ses goûts musicaux.
Les plateformes de streaming travaillent à l’identification du goût des utilisateurs dans le but d’affiner leurs recommandations algorithmiques. Mais, en étudiant leurs métadonnées, elles vont se rendre compte que l’utilisateur n’a pas constamment les mêmes goûts et les mêmes habitudes de consommation. Bientôt, l’utilisateur sera perçu comme un pluriel, dans la lignée des travaux de Gilles Deleuze (1992) qui considère les individus comme la somme de « dividus ». Dans Les Netocrates 2, A. Bard et J. Söderqvist (2011), définissent cette notion « le dividu nourrit en son sein de multiples identités, dont aucune n’est perçue comme plus réelle ou plus originale que les autres, et permet à chaque facette de prévaloir sur les autres en fonction des nécessités de l’adaptation au contexte, alors que l’individu s’efforce de n’être qu’une même personnalité ». Dans l’industrie du streaming, saisir que l’auditeur est divisible revient à essayer de comprendre les contextes dans lequel l’utilisateur écoute sa musique. Nous insistions déjà dessus dans le chapitre « De la Playlist à la Contextualisation et à la Musicalisation du Quotidien » de notre troisième Cahier IP (p.32 à 34). Les plateformes de streaming vont peu à peu tourner le dos au « Immutable Preference Paradigme » qui concevait les individus comme un être dont les envies n’évoluent pas et dont les goûts musicaux restent identiques (Pagano et al, 2016). A partir de 2014, les ingénieurs de Spotify commencent à intégrer la compréhension du contexte aux recommandations proposées par les algorithmes. Pour cela ils corrèlent des facteurs extrinsèques – tels que le jour de l’année, l’horaire d’écoute, le lieu d’écoute, le style de musique, l’humeur des morceaux – avec des facteurs intrinsèques – tels que la personnalité de l’utilisateur, son état émotionnel, etc. Ces différents éléments de contextes sont déduits des informations collectées auprès de l’utilisateur à l’aide de medium de plus en plus variés (nous mentionnions par exemple dans l’article 1 de ce dossier le brevet relatif à la reconnaissance vocale déposé par Spotify début 2018 qui devrait servir à analyser l’état émotionnel des individus). Ayant réussi à cerner l’environnement de l’individu, les systèmes de recommandation initient ensuite des recommandations personnalisées. Par exemple, au moment de se coucher, l’utilisateur pourra voir apparaître sur sa page d’accueil une playlist spécialement conçue pour la nuit et adaptée à ses goûts musicaux.
La personnalisation influence le devenir de l’individu
Alors que les algorithmes de recommandation tendent à associer notre profil avec celui d’autres utilisateurs afin de nous proposer des recommandations similaires – c’est ce qu’on appelle le filtrage collaboratif – ce profilage peut en incommoder certains. En effet, selon le sociologue Nick Prior (2013) « la musique est une expression personnelle de notre individualité, elle est intrinsèquement agréable et donc au-delà de toute mesure rationnelle ». Pour comprendre cette position, il faut étudier le travail du philosophe français Gilbert Simondon (1992) qui propose de changer de focale en passant de l’étude de l’individu à celle des processus d’individuation, c’est-à-dire des processus via lesquels l’individu se construit et développe ses goûts, sa personnalité... Le philosophe critique les théories supposant l’existence d’individus pleinement constitués. Selon lui, le sujet individuel est un effet de l’individuation plutôt que sa cause, il n’est jamais donné d’avance et n’est jamais définitif. Au contraire, l’individu doit être produit dans un processus continu qui a toujours des possibilités de transformation et devient un processus de devenir. A travers l’ensemble des actes que nous effectuons quotidiennement – des chansons que nous écoutons aux produits que nous achetons – nous évoluons en tant qu’individu et produisons activement notre identité. A ce titre, les algorithmes de recommandation présents sur les plateformes de streaming doivent être considérés comme des outils « d’individuation algorithmique » – c’est-à-dire comme des outils qui participent à la formation de l’individu (Zuilhof, 2014 in R. Prey). Par exemple, quand nous écoutons un morceau recommandé par une playlist générée automatiquement et que nous l’apprécions, cela contribue à transformer nos goûts musicaux.
Le concept d’individuation algorithmique modifie ainsi la manière dont on perçoit les algorithmes de recommandation. La question n’est plus de savoir si ces services nous ont « bien » compris. Il faut plutôt se demander comment les outils de recommandation nous perçoivent et interprètent nos comportements. Si les groupes découverts sur les playlists générées par Spotify et les marques qui nous ciblent via la publicité personnalisée (ce point est développé dans notre dossier consacré au fonctionnement des cookies publicitaires) correspondent plus ou moins à nos goûts, elles ont une influence relative sur la manière dont se construit l’individu. Sur les plateformes de streaming, ce processus d’individuation est pris en compte par les systèmes de recommandation en fusionnant ce que nos données disent de nous avec ce que nous pourrions être. Selon Cheney-Lippold (2011), l’individuation algorithmique ne délimite pas qui nous devrions être par des discours normatifs mais en « rattachant le potentiel de futurs alternatifs à nos actions précédentes en tant qu'utilisateurs basés sur la consommation et la recherche pour la consommation ».
Ainsi, comprendre que les algorithmes de recommandation ont une influence relative sur la manière dont se construit l’individu appelle à s’interroger sur la responsabilité des plateformes utilisant une telle technologie. Nous traiterons ce sujet dans le prochain article de ce dossier consacré aux grands challenges auxquels sont confrontés les algorithmes de recommandation.