Deep Learning, LLM, réseau de neurones, IA faible ou forte… vous êtes perdu face à ce langage obscur ? On vous explique les principaux termes utilisés en IA.
Quand on évoque l’intelligence artificielle (IA), la première idée qui vient bien souvent en tête est celle d’une grande boîte noire qui serait « nourrie » d’un côté de grandes bases de données par des scientifiques à lunettes et blouse blanche et, de l’autre, serait capable de régurgiter toutes ces informations de manière intelligible et structurée en fonction des questions posées par des personnes lambda comme vous et moi. Le principe n’est pas totalement faux.
L’intelligence artificielle est néanmoins structurée par de grands concepts qui font qu’il n’y a rien de « magique » là-dedans, mais des systèmes d’apprentissage différents ainsi que différents niveaux d’intelligence artificielle, entre IA faibles et IA fortes. Ce qui n’est pas du tout un jugement de valeur mais des niveaux de complexité bien différents. On vous explique tout ci-dessous.
Deep Learning
Le Deep Learning – ou apprentissage profond – est un sous-domaine de l’intelligence artificielle qui utilise des réseaux de neurones artificiels (cf. définition ci-dessous) pour apprendre à partir de données. Le Deep Learning pilote de nombreuses applications et services d’intelligence artificielle (IA) qui améliorent l’automatisation. Cela permet à une machine d’effectuer des tâches analytiques et physiques sans intervention humaine.
On le retrouve derrière des produits et services de tous les jours comme les assistants vocaux, la reconnaissance faciale, la détection de fraude à la carte de crédit, l’identification de vos amis sur une photo Facebook, etc. ChatGPT est aussi basé sur le Deep Learning.
Neural Network ou réseau de neurones
Un réseau de neurones est un algorithme qui s’inspire du fonctionnement des neurones biologiques. À la base, un réseau de neurones est essentiellement un réseau d’équations mathématiques. Ce réseau est composé de dizaines, voire de centaines, de « couches » de neurones. Chaque couche effectue un calcul élémentaire en reprenant les résultats du calcul de la couche précédente. C’est l’accumulation de tous ces calculs qui donne toute la puissance de l’ensemble.
Le réseau de neurones est généralement utilisé pour des problématiques de prédiction et de classement. Ces systèmes permettent par exemple de reconnaître les objets présents dans une image ou encore, dans une voiture autonome, à détecter les piétons ou tout autre obstacle sur la route.
À lire aussi
Machine Learning
Avec le Deep Learning, c’est l’autre grand principe d’apprentissage d’une intelligence artificielle. C’est la version la plus ancienne et la plus simple. La principale différence entre les deux est que le Deep Learning utilise des réseaux de neurones artificiels pour apprendre à partir de données, tandis que le Machine Learning utilise des algorithmes pour apprendre à partir de données, sans programmation particulière. C’est-à-dire que l’algorithme adapte lui-même le système à partir des feedbacks ou retours faits par les êtres humains. On appelle aussi cela un apprentissage « automatique ».
L’avantage du Machine Learning est qu’il a besoin de beaucoup moins de données fournies pour l’apprentissage (ce qu’on qualifie de « base de données contrôlable ») quand le Deep Learning a besoin, justement, d’une centaine de millions d’entrées avant de fournir des résultats fiables. Mais il n’est pas nécessaire, dans ce cas, d’indiquer les caractéristiques discriminantes des données. Il s’agit donc de deux approches différentes selon les types de datas disponibles.
LLM ou grands modèles de langage
Les grands modèles de langage (Large Langage Models) sont des modèles d’IA qui peuvent générer du texte à partir d’un texte d’entrée. Ils sont utilisés dans diverses applications telles que la traduction automatique, la génération de texte ou encore la reconnaissance vocale. ChatGPT est un exemple de LLM.
IA faible/IA forte
On parle d’intelligence artificielle « faible » non pas parce qu’elle n’est pas très efficace, mais parce qu’elle se limite à un ou deux domaines en particulier. Par exemple, elle sera efficace sur la thématique de la géographie, mais si on lui pose une question sur tout autre chose, elle sera incapable d’y répondre. Les IA dans les jeux de société – tels que les échecs ou le jeu de go – sont des exemples d’IA faibles. Siri, Alexa et Google Search sont également des IA faibles (ou étroites) dans le sens où elles ne sont capables de faire que certaines tâches.
En revanche, la voiture autonome est un exemple d’IA forte, car elle peut prendre une décision (freiner, s’arrêter, tourner) et éviter certains incidents. Elle peut notamment faire des choix pour éviter un piéton ou un autre véhicule. Et ChatGPT ? Elle est encore plutôt considérée comme une IA faible dans le sens où, même si elle peut sembler assez « généraliste », c’est en quelque sorte une combinaison de pleins d’IA faibles compilées (faire un résumé, traduire, chercher une information, créer un classement, etc.). Mais cette intelligence artificielle ne peut remplacer finalement qu’une petite partie du cerveau et est encore loin de pouvoir se substituer à l’intelligence humaine et ses quatre grandes capacités cognitives : percevoir, comprendre, agir et apprendre.