Où se cache la magie des algorithmes de recommandation musicale ?
Rédigé par Olivier Desbiey
-
06 April 2016Un article de Quartz publié en décembre 2015 décortique le fonctionnement de l’algorithme de recommandation de Spotify. Quelques semaines plus tôt, nous interrogions les utilisateurs français des services de streaming sur leur compréhension de ces mécanismes.
La recommandation personnalisée est devenue la véritable zone de concurrence et de différenciation des services de streaming musical, comme nous le soulignons dans le Cahier IP 3 « Les données, muses et frontière de la création ». Pandora, Deezer, Apple Music placent tous la recommandation selon les goûts de l’utilisateur au centre de leur stratégie de communication.
DEEZER
Votre Flow. Toute votre musique.
100% personalisée.
"Avec votre Flow vous êtes certains de tomber sur la musique que vous avez envie d'écouter. Il connait votre bibliothèque et vous propose une sélection de titres à votre image. Dites-lui aussi ce que vous aimez, ce que vous n'aimez pas, il s'adapte à vous comme par magie."
Apple Music
Dis-moi qui tu aimes, je te dirai qui tu es sûr d'adorer.
"Tout le monde aime découvrir de nouveaux titres. Et grace à nous, vous n'aurez même pas à les chercher. Dites-nous simplement quels sont vos genres ou vos groupes préférés, et nos experts vous feront des suggestions adaptées. Vous pouvez leur faire confiance, ce sont de vrais connaisseurs passionnés. (...) Ils vous créent ensuite des playlists que même votre meilleur ami serait incapable de préparer à vous."
Dans un contexte où ces services se différencient finalement assez peu, sur les catalogues pas plus que sur les tarifs, – généralement autour de dix euros par mois pour un accès illimité – le design de l’expérience utilisateur et les fonctionnalités de la plateforme deviennent centraux. La promesse de deviner le prochain morceau qui plaira à l’utilisateur semble être aujourd’hui la fonctionnalité qui concentre le plus de ressources. Incarnés en particulier par flow chez Deezer et découvertes de la semaine chez Spotify, les recommandations personnalisées plaisent aux utilisateurs.
Les utilisateurs recommandent les recommandations
Dix semaines après le lancement de sa playlist personnalisée de 30 titres du lundi matin, Spotify revendiquait fièrement déjà 1 milliard de morceaux écoutés mais surtout que 60% des utilisateurs en écoutaient au moins cinq titres et que 71% en avaient sauvegardé au moins un dans une playlist. Les utilisateurs français plébiscitent autant cette nouvelle manière de découvrir la musique : 60% disent en effet écouter les recommandations musicales personnalisées (74% des abonnés payants) selon une étude Médiamétrie réalisée pour la Cnil sur des utilisateurs de Deezer et Spotify en septembre 2015.
65% des utilisateurs apprécient les recommandations personnalisées des services de streaming
Ils sont encore plus nombreux à les apprécier (65% et même 76% parmi les abonnés payants). Par ailleurs, ces recommandations, pour plaisantes qu’elles sont, restent mystérieuses : près d’un utilisateur sur deux nous dit s’être déjà interrogé sur le fonctionnement du système de recommandation. Comme eux, le journaliste de Quartz Adam Pasick s’est lui aussi demandé comment fonctionnait l’algorithme de recommandation de Spotify qui génère la playlist du lundi matin. En échangeant avec les ingénieurs en charge de cette fonctionnalité, il a pu avoir accès aux caractéristiques détaillées de son profil d’écoute et aux ingrédients qui composent la recette désormais un peu moins magique de l’algorithme.
(source : From idea to execution : spotify’s discover weekly – DataEngConf – nov 2015 - Slideshare)
Le principe de la fonctionnalité « découvertes de la semaine » consiste à proposer une sélection de 30 chansons (parmi un catalogue de plus de 30 millions de titres) adaptée aux profils de chacun des utilisateurs (75 millions en juin 2015).
- Chaque utilisateur se voit associé un profil de goûts en fonction de ses écoutes et de ses morceaux sauvegardés. De cette manière son profil sera rapproché de micro-genres musicaux très précis comme par exemple « indie r&b alternative dance synthpop » ;
- De l’autre côté de la recommandation, c’est au travers de l’analyse des playlists générées par les utilisateurs – environ 2 milliards – que Spotify identifie des morceaux similaires.
L’algorithme rapproche ainsi les morceaux identifiés qui correspondent au profil de l’utilisateur, mais qu’il n’a pas encore écoutés. La magie de l’algorithme provient donc essentiellement du travail d’édition et de classement de l'ensemble des utilisateurs au travers de leurs propres playlists.
Dans le cadre de l’étude réalisée avec Médiamétrie, nous avions également interrogé les utilisateurs sur leurs perceptions du fonctionnement des recommandations.
Perception du fonctionnement des recommendations
Question : Selon vous, comment vous sont proposées les recommandations musicales personnalisées ?
Base : Internautes de 15 ans et plus utilisateurs d'un service de musique en streaming (n=441)
7 utilisateurs sur 10 ont donc vu juste en considérant que leurs écoutes et leurs morceaux favoris étaient utilisés et près d’un tiers pensaient également que le comportement des autres utilisateurs avait une influence.
En revanche, plus d’un tiers des utilisateurs pensent que leurs recommandations sont fonction des choix du service de musique en ligne : en lien avec les dernières nouveautés ou en fonction d’accords avec des producteurs.
En particulier 19% estiment que c'est la plateforme qui choisit les contenus dont elle souhaite faire la promotion.
La recommandation peut-elle être neutre ?
Cette idée selon laquelle les recommandations seraient basées sur les intérêts de la plateforme est évidemment fortement rejetée par les responsables de la plateforme suédoise, Matthew Ogle répondant à Quartz que Spotify n’alimente jamais intentionnellement les playlists avec des chansons en particulier, en dépit de demandes répétées des artistes et des labels. :
“we think Discover Weekly should remain firewalled from that sort of thing.” (Matthew Ogle, Discover Weekly head, Spotify)
Pour autant, la réalité est pour le moment que cette neutralité peut être affirmée mais pas réellement prouvée (ce qui nous renvoie au débat actuel sur la neutralité des plateformes, qu’il ait lieu au Conseil national du numérique, à la Commission européenne ou dans le cadre de la loi « Lemaire » pour une République numérique).Enfin, un pourcentage non négligeable (22%) imagine que des données provenant d’autres services peuvent être mobilisées quand une minorité (5%) pense que des données plus contextuelles comme la localisation permettent de mieux personnaliser la recommandation.
En réalité, et si l’article de Quartz ne rentre pas dans ces détails, on peut faire l’hypothèse que les données contextuelles deviennent de plus en plus importantes dans l’affinage des recommandations musicales. On en trouve un indice lorsque les data scientists de Spotify soulignent que leurs algorithmes excluent volontairement certaines écoutes atypiques. Par exemple, des personnes qui « écoutent des bandes sons de pluie en forêt pour s’endormir ne doivent pas les voir arriver dans leur recommandation du lundi : l’heure d’écoute peut à cet égard livrer des informations utiles à l’algorithme.
Car c’est là le dernier enseignement de l’article de Quartz : si le mécanisme de recommandations peut-être en partie explicitée, l’explication est incomplète car le nombre de facteurs et d’algorithmes alimentant le processus croit fortement, en particulier par la généralisation de l’usage du « deep learning » (apprentissage profond) et des réseaux neuronaux dans ces outils de prédiction et de recommandation. Adam Pasick conclut d’ailleurs l’article avec quelques conseils pour optimiser le système de recommandation de Spotify et précise que les titres lus en mode « écoute privée » ne sont pas utilisés par l’algorithme…