Learning Analytics : quelles sont les données du problème ?

Rédigé par Régis Chatellier

 - 

27 juin 2017


Assistera-t-on à une ruée vers les gisements de données collectées par les nouveaux outils d’apprentissage en ligne ? 

Book - Pixabay - CC-BY - Ivan Pais

L’éducation et la formation tout au long de la vie constituent l’un des nouveaux eldorados du numérique. Les méthodes d’apprentissage en ligne se développent sous la forme de Moocs, de plateformes d’e-learning, passent par les réseaux sociaux, sont disponibles sur ordinateurs, tablettes, et smartphones. Autant de pratiques qui laissent des traces du passage de leurs utilisateurs (nombre de clics par lien, fréquence et temps d’utilisations,…), des indicateurs de leurs performances (résultats de tests ou d’épreuves), de leurs interactions, en plus de données sociodémographiques, (âge, sexe, niveau d’éducation, culture, langue…). 

L’analyse de ces traces constitue une nouvelle discipline, les Learning Analytics, soit « la mesure, la collecte, l’analyse et la production de données des processus d’apprentissage » (wikipedia), par des techniques d’analyse de données. L’objectif annoncé est de permettre d’améliorer les formations et la pédagogie, par une connaissance fine de l’efficacité des exercices, des points sur lesquels butent les apprenants. On pourra par exemple évaluer les différentes méthodologies d’apprentissage par des pratiques d’A/B testing afin d’améliorer l’acquisition des compétences des élèves : tester plusieurs types d’exercices, analyser le temps et la qualité des réponses pour réévaluer les protocoles et les contenus. Ces plateformes permettraient en outre d’optimiser le coût des formations, de personnaliser les cursus et idéalement de motiver les étudiants, en leur apportant des retours sur les apprentissages.

Les méthodes du Learning Analytics et de l’Adaptive Learning promettent d’analyser et d’encadrer le les individus toujours plus finement. Invité du Congrès "Big Data & Learning Analytics", le professeur Andreas Dengel (Centre allemand de recherche pour l’intelligence artificielle) travaille par exemple sur le projet Hypermind, un manuel scolaire « anticipatif », grâce auquel nos yeux seraient l’interface donnant à voir notre comportement cognitif (par des lunettes qui suivraient les mouvements oculaires). Si un passage est lu plus lentement, posant d’apparentes difficultés, le manuel serait en mesure de fournir des informations pour mieux expliquer le contenu, s’adaptant aux besoins subjectifs et aux compétences de chacun, dans un système où « l’apprenant lit le livre, et le livre lit l’apprenant ». Le fait de connaître le comportement de l’apprenant permettrait de proposer des étapes intermédiaires à ceux qui en ont besoin. Per Benjamin (Institut de Recherche de formation à distance et e-Learning), souhaite pour sa part utiliser les données des comportements d’apprentissage pour adapter de manière automatisée les contenus d’enseignements, du « sur mesure aux besoins de chacun ».

 

Des données à l’école, et en dehors

Des enseignants ont déjà recours à ce type de plateforme, en complément des cours dispensés à l’école, par exemple EducLever, Kwyk ou Maxicourt. D’autres outils sont utilisés, par exemple les robots open source Thymio, sur lesquels les élèves apprennent à travailler collectivement, localement et au niveau mondial dans du travail collaboratif. Toutes ces solutions proposées dans le cadre de l’école ont aussi pour conséquences de collecter des données des élèves, des données qui ne figurent cependant pas au dossier pédagogique. 

Du lycée au supérieur, la vague des Moocs a déferlé depuis quelques années, ces cours « massifs » en lignes se sont développés, proposés par des acteurs privés ou public. Des outils qui génèrent eux aussi de nouvelles données fines de consultation. Il est notamment possible de savoir pour chaque étudiant s’il a réellement suivi le cours, à quel moment il a abandonné, s’il a visionné plusieurs fois la même partie, etc. Ces méthodes peuvent de la même manière être intégrées à la formation professionnelle et en entreprise.

 

Des données et des enjeux

Si elles sont utiles à l’amélioration globale de la plateforme, la production et la réutilisation de ces données interrogent : elles pourraient tout aussi bien être utilisées pour prédire des situations d’échec, détecter des élèves à risque (comme le early warning system - EWS -  dans le domaine des sciences et mathématiques), enfermer les élèves dans des parcours scolaires « adaptés à leur profil »,  prédire les abandons dans les Moocs, voire même fournir des profils adaptés à des employeurs potentiels… Des finalités qui pour certaines, si elles ne sont pas encadrées, pourraient aboutir à des formes de discrimination. 

Dans une vision plus prospective, la problématique à venir pourrait être celle que nous avions soulevée pour les jeux vidéo dans notre cahier sur les industries culturelles : en associant les plateformes d’apprentissage en ligne à différents capteurs, notamment les caméras (reconnaissance de la personne, analyse des émotions), températures, etc… on pourrait être en mesure de capter toujours plus finement la manière dont fonctionnent les individus.

 

Usages pour d’autres finalités

Ces données de profilage presque psychologiques pourraient, utilisées dans un autre contexte, s’avérer particulièrement utiles par exemple pour le recrutement. Si les données de la plateforme publique FUN (France Université Numérique) ne sont pas réutilisables pour des usages commerciaux, des plateformes privées cherchent déjà à développer des marchés bifaces. Dès 2012, la plateforme étasunienne Coursera étudiait la possibilité de mettre en relation des étudiants avec des entreprises

Au-delà du recrutement, ces analyses de profils psychologiques pourraient également être utilisées pour déceler des comportements à risque, à la manière dont certaines assurances cherchent à se baser les profils psychologiques inférés de Facebook. En novembre 2016, la compagnie Admiral avait tenté d’établir (avant d’être bloqué par Facebook) des profils de jeunes conducteurs selon leurs comportements sur le réseau social, notamment leur manière de s’exprimer, afin de définir des profils de risque. Enfin, les plateformes pourraient chercher à revendre leurs données à des tiers à de fins marketing : en 2014, la société Inbloom avait contracté avec les écoles de neuf états américains pour collecter et analyser les données de leurs élèves, afin de tirer des conclusions quant à leurs performances académiques. Bien qu’aucun problème n’ait été directement constaté, des parents et des associations de défense de la vie privée avaient réussi à faire cesser le contrat arguant que les enregistrements de données d’enfants âgés de 5 ans pour les plus jeunes pourraient être revendues à des société de marketing voire interceptées par des tiers. 

La CNIL faisait part en mai 2017 de ses positions quant à l’encadrement des services numériques dans l’éducation, dans le cadre de l’initiative Charte de confiance portée par le Ministère de l’éducation, précisant que « compte tenu de la sensibilité de ces données,  cette charte devrait se traduire par un encadrement juridique contraignant tant en ce qui concerne la non utilisation des données scolaires à des fins commerciales, l’hébergement de ces données en France ou en Europe ou encore l’obligation de prendre des mesures de sécurité conformes aux normes en vigueur. » Concernant l’analyse de l’apprentissage et plus particulièrement les modèles prédictifs qui en découleraient, l’article 10 de la loi informatique et libertés dispose qu’aucune « décision produisant des effets juridiques à l'égard d'une personne ne peut être prise sur le seul fondement d'un traitement automatisé de données destiné à définir le profil de l'intéressé ou à évaluer certains aspects de sa personnalité. »

Comme tout nouveau champ de création de données, les Learning Analytics seront à surveiller de près par le régulateur. Au-delà de l’aspect juridique, des questions seront certainement à soulever du côté de l’éthique, dès lors que l’on cherchera à classer les élèves dès leur plus jeune âge pour repérer des cas de déviance, avec le risque de les enfermer dans des bulles d’échec. Pour que les données de leur enfance ne les poursuivent pas tout au long de leur vie. 

 

 




Régis Chatellier
Article rédigé par Régis Chatellier, Chargé des études prospectives