Avez-vous déjà entendu parler du « Machine Teaching » ?
Learning Innovation
Cet article fait partie de notre série consacrée à la recherche et à l’innovation liées à l’apprentissage, proposée par Coorpacademy en association avec le Centre LEARN de l’EPFL (l’École polytechnique fédérale de Lausanne en Suisse). Son auteur, Pierre Dillenbourg, est Professeur à l’EPFL, Responsable du CHILI Lab (laboratoire spécialisé dans les interactions homme-machine) et Directeur du Swiss EdTech Collider (incubateur spécialisé dans les technologies éducatives).
Des concepts tels que le Machine Learning, le Deep Learning et l’intelligence artificielle sont désormais connus de tous. Il faut désormais ajouter à cette liste un nouveau concept, le « Machine Teaching », que nous allons vous présenter en explorant ses implications possibles dans le domaine de l’éducation.
Un nouveau paradigme, le Machine Teaching
Imaginons un algorithme qui doit apprendre à identifier des éléphants sur des images. Dans le cadre d’un processus supervisé de Machine Learning, on lui fournit un exemple – par exemple, la photo 3465 – et un attribut tel que « éléphant » ou « non-éléphant ». Il se peut que la photo 3465 lui soit présentée après quelques milliers d’autres photos ayant le même attribut. Mais si les 3464 photos précédentes montraient toutes des éléphants d’Afrique, une énième photo de cette même espèce serait moins utile au système que l’introduction inédite d’une photo d’éléphant d’Asie.
De même, si toutes les photos précédentes montraient principalement des éléphants adultes, il serait plus utile pour l’apprentissage de l’algorithme de lui présenter un éléphant jeune. Et si la plupart des éléphants étaient représentés de côté, une vue de face améliorerait les connaissances acquises par l’algorithme.
En d’autres termes, si les exemples n’étaient pas présentés de façon aléatoire à l’algorithme « en apprentissage », mais sélectionnés de façon stratégique, les performances d’apprentissage de la machine pourraient être globalement optimisées. Dans le contexte d’une salle de classe, choisir des exemples est le rôle de l’enseignant : il ou elle sait que si tous les exemples de carrés montrés aux apprenants sont en position horizontale, ils inféreront qu’un carré présentant une rotation de 45 degrés n’est pas un carré.
Un algorithme qui parvient à déterminer la séquence d’exemples optimale à proposer à un système d’apprentissage automatique, en veillant à ce que ces exemples soient suffisamment variés et différents des précédents, peut être qualifié d’algorithme de Machine Teaching.
Quel potentiel pour le Machine Teaching ?
Si un algorithme reçoit des exemples aléatoires, sans considération stratégique sur le type d’exemples et ce que l’algorithme pourra en extraire pour son apprentissage, des problèmes surgiront inévitablement. Tout d’abord, il ne faut pas confondre la taille de l’échantillon de données et son utilité intrinsèque : la simple présentation d’une grosse masse de données à un algorithme de Machine Learning ne suffit pas à garantir l’acquisition des connaissances voulues, ni les performances futures de l’IA. Par ailleurs, l’algorithme pourrait tendre vers une prise de décision erronée ou biaisée. Revenons sur notre exemple d’identification d’éléphants à partir de photos : si les seules photos avec l’attribut « non-éléphant » représentent des animaux blancs, l’algorithme peut inférer que seuls les animaux blancs doivent être catégorisés comme non-éléphants. Cela peut sembler stupide, mais ce type de biais s’introduit fréquemment et s’accompagne de certaines conséquences. Des algorithmes biaisés peuvent renforcer les stéréotypes liés au genre (comme ce fut le cas du service de traduction de Google) ou peuvent induire de mauvaises prises de décisions (comme les systèmes d’aide à la décision utilisés par des juges aux États-Unis, qui surestiment la probabilité de récidive des populations afro-américaines).
Quelles sont les applications possibles dans le domaine de l’éducation ?
L’impact de l’intelligence artificielle sur l’éducation s’étend sur trois niveaux : (1) Méthode : l’IA peut renforcer l’efficacité des technologies éducatives utilisées et permettre une meilleure adaptation de l’enseignement aux besoins spécifiques de l’apprenant. Au fil du temps, un système peut apprendre à détecter les activités pédagogiques optimales selon le profil d’un apprenant donné. (2) Contenu : l’IA fait évoluer ce que les apprenants devraient ou ne devraient pas apprendre, et accélère également la production des supports pédagogiques, par exemple en générant des questions à partir de Wikipédia. (3) Gestion : l’IA, et notamment les sciences des données, offrent de nouveaux moyens de gestion des systèmes éducatifs (par exemple en prévoyant l’échec probable des apprenants).
Le Machine Teaching s’avère pertinent dans toutes ces applications. Un apprentissage personnalisé, fondé sur les systèmes recommandés, ne peut être bien adapté aux besoins particuliers d’un apprenant que si l’ensemble de données sur lequel se fonde la recommandation est assez vaste et équilibré. Il nous faut donc utiliser une sélection non aléatoire des données pour tout apprentissage automatique, en alimentant l’algorithme avec des données indiquant les méthodes les plus efficaces pour tous les types d’apprenants.
S’agissant du contenu, l’enseignement en sciences des données et en Machine Learning doit apprendre à concevoir des bases de données optimales pour l’apprentissage des algorithmes. Les ingénieurs deviennent des enseignants auprès des algorithmes d’apprentissage automatique, car une simple programmation ne suffit pas. Nous devons faciliter la prise de décisions judicieuses par l’algorithme, à l’instar d’un bon enseignant qui apprend à ses élèves à développer des compétences de résolution de problèmes et de réflexion critique.
L’innovation en matière de sciences de l’apprentissage et de technologies éducatives fait partie des priorités de Coorpacademy. Elle est essentielle à notre mission qui consiste à améliorer constamment l’expérience d’apprentissage sur notre plateforme, en la rendant toujours plus personnalisée, flexible et agréable pour les apprenants.