Les grands “inventeurs” des IA (John Hopfield, Yann Le Cun, Geoffrey Hinton, Judea Pearl, Richard Sutton, Andrew Barto…) se sont intéressés aux études sur le cerveau humain et aux travaux de pédagogues comme Jean Piaget, pour comprendre comment l’apprentissage humain pouvait être “modélisé” et introduit dans une machine !
À la base, deux façons d’entrainer les IA conversationnelles
L’IA au départ est (sommairement) “instruite” par deux méthodes : les “apprentissages supervisés” ou “non supervisés”, tous deux supposant beaucoup de puissance de calcul…
Dans l’apprentissage supervisé, le concepteur de l’IA lui donne à la fois l’entrée et la réponse correcte.
En apprentissage non supervisé, l’IA s’entraine par exemple à deviner les mots qui manquent dans une phrase. Elle ingurgite d’abord énormément de textes, pour identifier des mots apparaissant souvent ensemble dans des phrases. Exemple : “chat”, “chien”, “mangent” et “animaux”. En analysant la place de mots dans les phrases, elle finit (statistiquement) par voir des corrélations grammaticales et deviner les 2 mots manquants “des croquettes” dans la phrase : “le chat et le chien sont des animaux qui mangent des croquettes”.
Comment les IA apprennent encore ?
Une IA de type ChatGPT apprend en ajustant ses “prédictions” en fonction des erreurs commises et des retours des utilisateurs. DeepSeek, nouvelle star des IA, s’entraînerait par “transfer learning”.Grosso modo, au lieu de recommencer son entraînement depuis zéro à chaque fois, elle “transfèrerait” des connaissances déjà acquises. Ses concepteurs ont dû s’inspirer de ce qu’on appelle le transfert pédagogique pour les humains. Nos IA s’améliorent donc au fur et à mesure de notre utilisation ! Elle apprennent de nos feed-back et les sollicitent pour ajuster leurs algorithmes… Elles s’habituent à nos demandes, à nos façons d’interagir avec elles et peuvent même s’auto-critiquer !
Comment apprennent les êtres humains ?
Si on simplifie là-aussi, on peut repérer des grandes “familles” d’apprentissage chez nous, les humains :
- L’apprentissage par imitation et exemples.
- L’apprentissage statistique.
- L’humain peut aussi se développer et apprendre par la “résistance cognitive”
- L’apprentissage par tâtonnement expérimental.