Les réseaux de neurones, ou plus précisément, les réseaux de neurones artificiels, sont des dispositifs qui permettent de traiter l’information. Et s’ils portent ce nom, c’est parce qu’il s’agit d’algorithmes, d’instructions machine dont la structure rappelle celle du cortex cérébral, mais à plus petite échelle.

Leur origine remonte à 1957, avec l’invention du Perceptron par Frank Rosenblatt : un réseau de neurones qui prend modèle sur la structure de la cellule nerveuse, en tenant compte également des dendrites – courts prolongements du neurone à travers lesquels passent des informations sous forme électrochimique.

Réseau de neurones artificiel simplifié.The computing universe, Gyuri Papay and Tony Hey, 2015

Dans le modèle des neurologues Warren McCulloch et Walter Pitts, les précurseurs des réseaux de neurones formels, la variable d’entrée est binaire : elle ne prend pour valeur que 0 ou 1. Chaque valeur d’entrée est ensuite pondérée de son poids, et la somme des entrées pondérées est introduite dans le modèle. Le Perceptron intègre donc plusieurs entrées binaires (D1, D2… DN), et produit en sortie une donnée binaire unique, qui indique si le seuil d’activation est atteint ou pas. A savoir, 0, si le résultat est plus petit ou égal au seuil, et 1, dans le cas contraire.

Réseau de neurones formels de type Perceptron Multicouche.HRcommons/Wikimedia

Partant de cette première version, le Perceptron a été amélioré de manière à ne plus limiter les valeurs d’entrée et la fonction de pondération aux valeurs binaires, mais à prendre en compte toutes les valeurs réelles. En faisant varier les poids et le seuil, nous pouvons obtenir des modèles de prise de décision différents. La donnée de sortie d’une couche cachée peut également être insérée dans une autre couche cachée du Perceptron.

En disposant de très grands jeux de données et d’une forte puissance de calcul, les machines peuvent désormais reconnaître des objets, traduire des discours, s’auto-entraîner à identifier des motifs complexes, apprendre à définir une stratégie et gérer des imprévus en temps réel. Ainsi, le deep learning suscite-t-il l’intérêt des entreprises chargées de travailler à la détection d’armes dissimulées dans des bagages, dans les services des douanes des ports et aéroports.