En 2011, Georges Siemens, théoricien de l’apprentissage et du connectivisme, définit les Learning analytics comme « la mesure, la collecte, l’analyse et le décryptage des données intelligentes produites par l’apprenant et de leurs contextes, dans le but de comprendre et d’optimiser l’apprentissage et les environnements dans lequel il se déroule. »
Les learning analytics correspondent donc à toutes les données et traces pertinentes laissées par l’apprenant sur la plateforme d’apprentissage qui retracent l’interactivité avec la plateforme et l’interaction avec les ressources pédagogiques, avec ses pairs et avec l’équipe pédagogique (tuteurs, learning community manager, formateurs…). L’analyse de ces données va permettre d’améliorer l’expérience apprenant et de maximiser l’efficacité du parcours de formation. Cet effort d’optimisation va porter non seulement sur la mémorisation et la compréhension des savoirs et savoir-faire mais également sur la motivation et l’engagement de l’apprenant et jusqu’à la délivrance de feedback immédiats lui permettant de prendre conscience de la façon dont il apprend et de ses axes de progrès.
La plupart des LMS du marché permettent aujourd’hui de récolter une masse de données, qu’il s’agisse des classiques données d’identification (nom, prénom, âge, sexe, cursus ou niveau académique), temps de connexion ou résultats aux évaluations, ou, pour les plus performants, des interactions sociales dans le dispositif de formation. Ces données vont devoir être structurées pour pouvoir être analysées et fournir, à l’équipe pédagogique, des pistes d’intervention au niveau de la communauté apprenante (ajustement du niveau et du volume de ressources pédagogiques à disposition, par exemple) et de l’apprenant au niveau individuel (complément pédagogique, séance de coaching…) dans une optique d’adaptive learning. La définition des données utiles en formation et leur structuration va permettre de compléter l’intervention de l’équipe pédagogique auprès de l’apprenant ou de la communauté apprenante par des actions automatisées générées par des algorithmes capables d’analyser les données en temps réel et d’appliquer des scénarios d’intervention sur-mesure.
1.
Suivre l’apprenant à la trace
L’éventail des données et des traces d’apprentissage laissées par un apprenant est vaste. De la présence à la performance, elles permettent de définir le profil de l’apprenant et l’évolution de son comportement dans le temps. Elles ont surtout vocation, au-delà du simple état des lieux, à apporter des solutions concrètes aux problèmes rencontrés par les apprenants dans leur parcours d’apprentissage.
L’enjeu des learning analytics et des algorithmes associés est donc de dépasser la simple description et le diagnostic pour aller vers des analyses prédictives et prescriptives.
Les données et traces recueillies sont de plusieurs natures qui, croisées, permettent d’établir des diagnostics précis et personnalisés. Ainsi peut-on mesurer :
- les périodes d’activité et d’inactivité de l’apprenant sur la semaine ou sur la journée (certains jours sont-ils plus creux que d’autres ?) ;
les taux de complétion du parcours (temps de connexion, téléchargement des documents, visionnage des vidéos, réalisation des évaluations formatives et sommatives…) ; - les scores aux évaluations : au niveau individuel le score peut mettre en évidence un besoin de soutien ou de mise à niveau et au niveau collectif le score peut être un indicateur de l’adéquation ou de l’inadéquation des activités proposées aux capacités de la communauté apprenante ;
- la participation (discussion sur les forums, sollicitation des tuteurs, pratique collaborative…) : au niveau individuel elle peut révéler l’engagement de l’apprenant (mais c’est surtout son évolution dans le temps qui sera intéressante pour identifier des moments de baisse d’activité et agir) et au niveau collectif elle peut permettre aux tuteurs et/ou au learning community manager d’ajuster leur niveau d’intervention au sein du groupe ;
- les choix réalisés sur un parcours non contraint : la navigation de l’apprenant dans le parcours et le choix des ressources pédagogiques ou sa décision d’abandonner des ressources peuvent constituer un bon indicateur de son niveau, de sa disponibilité, de sa rapidité d’apprentissage (la pertinence de ses choix étant mesurés par ses scores aux évaluations).
Tableaux de bord et structuration des données
Afin de récolter des données pertinentes pour l’optimisation et la personnalisation des parcours, l’équipe pédagogique devra définir l’information utile. Pour obtenir la bonne réponse, encore faut-il poser la bonne question au système.
Partir du scénario pédagogique et des ressources associées permet de définir la source des données : voulez-vous récolter des indicateurs sur les modules réalisés, sur les échanges entre pairs, sur les échanges avec les tuteurs, sur le nombre de rendez-vous pris avec un expert, sur la participation aux classes virtuelles ?
Toutes ces données seront stockées sur la plateforme (LMS, LRS), structurées et remontées dans des tableaux de bord pour être lisibles et exploitables. Le recueil et la mise en forme des données des apprenants est généralement réalisée grâce aux normes standards utilisées en formation digitale : SCORM, xAPI. Cette dernière permet de traquer un nombre plus important d’interactions de l’apprenant, intégrant les apprentissages formels et informels (social learning, notamment) et l’ensemble des devices utilisés par l’apprenant (mobile learning, par exemple).
Toutes ces traces d’apprentissage ont plusieurs objectifs :
- décrire l’activité de l’apprenant et du groupe sur la plateforme ;
- diagnostiquer les incidents sur le parcours (dysfonctionnements techniques, désintérêt du groupe ou d’un apprenant, inadéquation pédagogique au niveau du groupe…)
- prédire les comportements futurs des apprenants ou du groupe ;
- prescrire des actions correctives automatiques, déclenchées par les algorithmes (envoi de messages de remobilisation, par exemple) ou humaines (mise à disposition de nouveaux supports, interactions tutorales…).
Ce sont ainsi plusieurs niveaux d’analyse qui peuvent se combiner pour offrir à l’apprenant le parcours le plus efficace.
2.
Décrire, Diagnostiquer, Prédire, Prescrire : offrir un parcours proactif
De l’information brute à l’optimisation du parcours, on peut classer les analyses basées sur les learning analytics en 4 grandes catégories permettant de répondre à quatre grandes interrogations :
- l’analyse descriptive : elle vise à rendre compte de l’activité et des éventuels incidents sur le parcours de formation. Elle répond à la question : que se passe-t-il sur le parcours ?
- l’analyse diagnostic : elle interroge l’origine des actions (ou de l’inaction) des apprenants et les causes des incidents détectés par l’analyse descriptive. Elle répond à la question : pourquoi tel événement s’est-il produit sur le parcours ?
- l’analyse prédictive : les données récoltées, leur croisement, leur comparaison avec des bases de données plus larges (données nationales, par exemple) ou antérieures (données sur le groupe d’apprenant précédent, par exemple) vont permettre de créer des modèles prédictifs basés sur les observations passées et les activités en cours. Elle répond à la question : que va-t-il se passer sur le parcours au niveau individuel et collectif ?
- l’analyse prescriptive va transformer le diagnostic et les données prédictives en actions pédagogiques. Elle répond à la question : comment agir sur le parcours et sur les apprenants ?
Description et diagnostic relèvent ainsi du reporting quand la prédiction et la prescription relèvent de l’adaptive learning.
Analyse descriptive : un premier pas dans l’univers des données
Premier niveau d’analyse, elle constitue la base du retour d’expérience, permettant de replacer le projet dans son contexte et un premier bilan :
- combien d’apprenants ?
- combien de ressources consultées ?
- combien d’abandon ?
- quel taux de complétion ?
- combien d’heures passées sur le parcours ou sur chaque ressource ?
- combien de messages envoyés ?
- quelle utilisation du mobile learning ou du social learning ?
- quels résultats aux évaluations ?
- …
Analyse diagnostic : identifier les rapports de causalité
Étroitement liée à l’analyse descriptive, l’analyse diagnostic constitue une première étape d’exploitation des données et des traces d’apprentissage. On est ici dans la recherche d’explications.
L’analyse diagnostic va chercher à comprendre, a posteriori, l’origine (ou les multiples facteurs) de tel ou tel comportement inattendu de l’apprenant (pourquoi l’apprenant n’a-t-il pas validé le module 3 ? Est-ce le niveau de difficulté ? Du découragement ? Un format inadéquat de l’évaluation ou des ressources pédagogiques ? Un sentiment d’isolement ?…).
Pour identifier les causes d’un problème, l’équipe pédagogique doit disposer d’une diversité de données relatives à l’apprenant et au groupe (du sexe, à l’âge, au parcours, aux résultats, à la progression dans le parcours, aux interactions passées…) voire aux groupes et aux apprenants déjà formés sur le parcours. L’incident va être mis en regard de la temporalité (à quel moment dans le parcours ?), du groupe (l’incident est-il un cas isolé ou se répète-t-il ?).
Analyse prédictive : anticiper les problèmes
Au vu des résultats des analyses descriptive et diagnostic, il est possible de détecter a priori, des événements et incidents avant même leur réalisation. Les modèles prédictifs sont aujourd’hui très utilisés en marketing. Ils peuvent, au moyen d’algorithmes spécifiques, s’adapter au digital learning pour émettre des alertes et informer l’équipe pédagogique d’un risque d’abandon ou d’échec de l’apprenant.
L’algorithme va croiser toutes les données à sa disposition, notamment les résultats de l’apprenant aux évaluations ou aux tests de positionnement, son engagement et sa participation sur la plateforme, sur les forums et dans les activités collaboratives ainsi que son parcours académique et professionnel pour établir une probabilité d’incident dans son parcours. La pertinence de cette analyse prédictive est intimement liée à la qualité des données renseignées (souvent meilleures dans des dispositifs de formation développés par l’entreprise que dans des MOOC ouverts à tous et réalisés à titre personnel par l’apprenant) ou à l’antériorité des données.
Cette anticipation de l’évolution des comportements des apprenants va permettre de mettre en place une démarche proactive et des stratégies curatives. La baisse de motivation de l’apprenant, qui peut se caractériser par une absence soudaine sur la plateforme, une diminution sensible de ses temps de connexion, la baisse de ses résultats aux évaluations, pourra être compensée par des actions automatiques (envois de notifications automatiques pour engager l’apprenant à poursuivre, message d’encouragement…) gérées par l’algorithme mais aussi par une intervention humaine du tuteur notamment (lui-même alerté du risque par l’algorithme).
On entre ici dans l’analyse prescriptive et l’adaptive learning qui offrent à l’apprenant un parcours personnalisé en fonction de ses attentes, de ses préférences, de son niveau…
Analyse prescriptive : personnaliser les parcours
Les learnings analytics ont pour finalité la personnalisation des parcours au rythme, au niveau, aux préférences et aux attentes de chaque apprenant. Ce que l’on appelle l’adaptive learning. Cette individualisation des parcours repose sur l’analyse des données et des traces en temps réel pour ajuster les ressources mises à disposition de l’apprenant, procéder à une remédiation par l’intermédiaire de ressources complémentaires en cas de difficultés ou d’intervention tutorale pour briser l’isolement.
L’adaptive learning nécessite une ingénierie pédagogique très modulaire et non linéaire et une modélisation de parcours alternatifs en fonction des niveaux et des préférences (vidéos, audios, texte) des apprenants. Certaines matières s’y prêtent mieux que d’autres. Ainsi les mathématiques portent-elles intrinsèquement une structure logique plus définie et plus progressive que les sciences humaines, plus ouvertes aux cheminements multiples. Réaliser une cartographie des savoirs, des savoir-faire et des compétences, enrichie de métadonnées permettant de qualifier chaque grain de contenu, permet d’obtenir un parcours souple et adaptable.
Un apprenant ayant des résultats médiocres aura peut-être besoin de ressources supplémentaires reprenant les bases ou abordant le problème différemment. De la même façon, un apprenant très à l’aise, qui obtient de très bons résultats, participe beaucoup, pourra-t-il s’épargner certains modules pour éviter l’ennui et progresser plus rapidement.
De même, la scénarisation des relances mail ou sms doit-elle être construite comme un arbre de décision pour englober le maximum de situations. On peut alors se baser sur les données et les traces des apprenants ayant déjà réalisés la formation pour les ajuster. L’envoi d’une notification demandant, à un apprenant subitement absent du parcours, s’il a besoin d’aide pour se connecter ou d’un rendez vous avec un expert ou un tuteur pour faire le point sur sa progression, peut se révéler efficace pour le motiver à nouveau et l’inviter à poursuivre.
Enfin, l’analyse prescriptive et l’adaptive learning permettent d’ajuster les processus tutoraux aux attentes d’un apprenant à un instant « t », qui aura peut être besoin d’un accompagnement temporaire renforcé. L’algorithme ne fait pas tout et n’exonère pas l’équipe pédagogique d’une intervention en mode « manuel ».
Si les learning analytics apportent des solutions aux problèmes des apprenants, quasiment en temps réel, ils sont également riches d’enseignement pour l’équipe pédagogique qui questionne ses pratiques et ajuste ses dispositifs.
3.
Learning analytics : quels bénéfices ?
Les learning analytics répondent à un objectif d’efficience pour l’apprenant dans sa montée en compétence mais également à un impératif de qualité et d’adéquation de la formation avec les attentes de l’entreprise, pour l’équipe pédagogique.
L’apprenant pourra ainsi bénéficier :
- de ressources complémentaires adaptées et d’une remédiation appropriée en « just in time » si l’algorithme a détecté un risque d’échec ou d’abandon ;
- d’indications sur sa façon d’apprendre, favorisant la méta-cognition et la conscientisation des apprentissages ;
- d’un parcours allégé si son niveau est suffisant pour s’exonérer des certains modules, lui offrant ainsi la possibilité d’avancer plus vite et en minimisant le risque de lassitude voire d’ennui ;
- de feedback automatiques immédiats le renseignant sur son mode de consommation des ressources par rapport aux autres apprenants voire sur sa production de contenus partagés avec la communauté apprenante ;
- d’une interactivité à même de réduire la distance, par les relances à propos, les messages totalement personnalisés ;
- …
L’équipe pédagogique disposera, elle, d’indicateurs sur la pertinence du parcours en général mais également sur l’adéquation des ressources et des profils d’apprenants. Elle sera à même d’ajuster le processus tutoral et le nombre de tuteurs en fonction des problèmes et cas particuliers qui se font jour en temps réel. Elle sera assurée de fournir le meilleur séquencement à chaque apprenant ou à chaque sous-ensemble d’apprenants présentant les mêmes spécificités. Les learning analytics sont également un moyen de documenter toutes les décisions adoptées face à une problématique et de capitaliser sur les cohortes successives d’apprenants.
On le voit les traces produites et analysées peuvent être massives et en dire long sur l’apprenant. Cette masse de données, stockée dans la plateforme, pose alors le problème de la protection de la vie privée de l’apprenant. Là aussi le RGPD s’applique !
4.
RGPD et learning analytics
Toutes les données récoltées (identité, heures et temps de connexion, résultats aux évaluations, type de contenu consulté, réussite à un examen…) demeurent des données strictement personnelles à l’apprenant. En cela elles sont soumises au RGPD (Règlement Général sur la Protection des données), applicable depuis le 25 mai 2018 dans l’ensemble des États membres de l’Union européenne.
En matière de learning analytics, le plus grand risque est d’enfermer l’apprenant dans un stéréotype qui peut le suivre et impacter sa poursuite de carrière et son évolution professionnelle. La lutte contre ce risque de cataloguer l’apprenant entraînant in fine un risque de discrimination revient à l’entreprise mais également à l’organisme de formation et à l’éditeur de la plateforme.
Aujourd’hui le profilage (analyse prédictive du comportement) et les algorithmes de prise de décision sont strictement encadrés par le RGPD. L’article 4 alinéa 4 définit le profilage comme « toute forme de traitement automatisé de données à caractère personnel consistant à utiliser ces données à caractère personnel pour évaluer certains aspects personnels relatifs à une personne physique, notamment pour analyser ou prédire des éléments concernant le rendement au travail, la situation économique, la santé, les préférences personnelles, les intérêts, la fiabilité, le comportement, la localisation ou les déplacements de cette personne physique ».
L’article 22 du RGPD réglemente les « décisions entièrement automatisées » (décisions résultant des algorithmes) et énonce :
« La personne concernée a le droit de ne pas faire l’objet d’une décision fondée exclusivement sur un traitement automatisé, y compris le profilage, produisant des effets juridiques la concernant ou l’affectant de manière significative de façon similaire. » Ce principe ne s’applique pas si « la décision :
- est nécessaire à la conclusion ou à l’exécution d’un contrat entre la personne concernée et un responsable du traitement ;
est autorisée par le droit de l’Union ou le droit de l’État membre auquel le responsable du traitement est soumis et qui prévoit également des mesures appropriées pour la sauvegarde des droits et libertés et des intérêts légitimes de la personne concernée ; - ou est fondée sur le consentement explicite de la personne concernée. »
Le consentement de l’apprenant doit donc être recueilli expressément et ne peut pas se présumer. De même il convient de s’assurer du lieu de stockage et de l’utilisation faite des données par les partenaires (éditeur de plateformes, organismes de formations…). Tous les parties appelées à intervenir dans la formation digitale de l’apprenant doivent garantir le respect de la sécurité et de la confidentialité des données recueillies.
Les learning analytics n’en restent pas moins un formidable outil d’adaptation de la formation aux besoins précis de chaque apprenant. A ce titre, tous les acteurs doivent faire preuve de responsabilité vis-à-vis des apprenants et de leurs données d’apprentissage.
5.
Conclusion : Quel avenir pour les learning analytics ?
Suite à une consultation sur le devenir des learning analytics à l’horizon 2025, menée par le consortium LACE (Learning Analytics Community Exchange) en 2015, 8 scénarios sont ressortis, alternant entre top et flop du concept.
Les 103 experts internationaux consultés à ce sujet ont ainsi décrit les learning analytics en 2025 :
Scénario 1 : Les salles de classe surveillent l’environnement physique pour soutenir l’apprentissage et l’enseignement. Concrètement les capteurs investissent tous les recoins des salles de cours pour recueillir des données physiologiques et comportementales des élèves et adapter l’enseignement. L’adaptive learning glisse du distanciel au présentiel.
Scénario 2 : le suivi des données personnelles soutient l’apprentissage. En 2025, des capteurs portés sur soi analysent notre attention, notre niveau de fatigue et de stress, ainsi que des données relatives à notre métabolisme. De cette analyse émergent des recommandations en matière de méthodes d’apprentissage. Du quantifed self au qualified self…
Scénario 3 : les learning analytics sont rarement utilisés dans l’éducation. En 2015, les learning analytics ont fait la preuve de leur inefficacité et les parcours de formation assistés par algorithme jouissent d’une mauvaise réputation. Le flop !
Scénario 4 : les individus contrôlent leurs propres données. Conscients de la valeur de nos données, nous avons repris le contrôle et décidons à qui, quand, comment, pour combien de temps et pour quel bénéfice nous livrons nos données. La fin du « Si c’est gratuit c’est toi le produit » ?
Scénario 5 : les learning analytics désormais en open source sont généralisés et utilisés largement. Les éditeurs de solutions ont abandonné le champ de la protection de leurs logiciels. Ouvrir le champ des possibles.
Scénario 6 : les learning analytics sont indispensables à la pédagogie. Apprenants et équipes pédagogiques travaillent de concert sur la base d’analyse des données d’apprentissage fiables et d’algorithmes aux recommandations pertinentes pour garantir la réussite. Le Top !
Scénario 7 : les learning analytics soutiennent l’apprentissage autonome. La masse de données produites fiabilise les recommandations faites au moyen d’algorithmes. Désormais les voies d’apprentissage, les ressources et les parcours sont définis avec une pertinence individuelle inégalée par un prescripteur humain. A chacun selon ses besoins ? Reviens Karl !
Scénario 8 : la plupart des enseignements sont délégués aux ordinateurs. L’apprenant devient totalement autonome, travaille avec ses pairs, soutenu par des mentors. L’évaluation formative a détrôné la sacro-sainte évaluation sommative. Il n’existe plus de frontière entre formation initiale et formation continue. Me former où je veux, quand je veux, comme je veux !
Rendez-vous en 2025 !
Rendez-vous en 2025 !