Actu

Coup d’envoi pour Gemini 2.0 : la nouvelle version surpuissante de l’IA de Google

12 décembre 2024
Par Pierre Crochart
Coup d'envoi pour Gemini 2.0 : la nouvelle version surpuissante de l'IA de Google
©Google

Dans la course à l’intelligence artificielle la plus performante qui l’oppose frontalement à OpenAI, Google cherche à reprendre les devants.

Alors qu’OpenAI multiplie les annonces ces derniers jours, avec notamment la mise à disposition de son IA générative de vidéos ou encore la sortie de l’interface Canevas pour toutes et tous, Google dégaine sans crier gare Gemini 2.0, la toute dernière version de son modèle de langage. En quoi est-il différent de la version 1.5 jusqu’ici disponible ? On fait le tour du propriétaire.

L’IA multimodale ultime ?

Anticipation, compréhension, polyvalence. Voilà probablement les mots-clés qui définissent le mieux Gemini 2.0, désormais accessible en version « flash » (autrement dit bêta) auprès des utilisatrices et des utilisateurs gratuits et payants, depuis un navigateur sur ordinateur ou smartphone. Les applications dédiées suivront ultérieurement.

Au cœur du projet se trouve le concept d’agents, c’est-à-dire des assistants virtuels propulsés par l’IA, qui seraient capables d’anticiper les besoins des internautes pour leur faire gagner du temps et leur faciliter la vie. L’un des exemples cités par Google prend corps dans le projet Astra, l’agent multimodal capable d’analyser ce que vous lui montrez, de fournir des informations (sur un bâtiment, une architecture, un monument) et de s’adapter à la volée au langage de la personne qui lui parle, en temps réel.

Le projet Mariner est un autre exemple cité par Google pour illustrer la puissance de Gemini 2.0. Décrit comme un véritable bouleversement, il se présentera comme une extension pour navigateur Chrome, capable de prendre le contrôle de la navigation pour réaliser des actions à votre place. Par exemple, on peut prendre une photo d’une illustration que l’on aime et demander à Mariner de l’acheter pour nous. L’agent effectuera une recherche web, trouvera la source de l’image et ajoutera l’illustration à votre panier sans que vous ayez besoin de toucher votre souris ou votre clavier.

L’intelligence artificielle vous aide à devenir meilleur en jeu

Les applications potentielles de Gemini 2.0 sont étourdissantes et semblent s’inviter aussi bien dans le monde réel que dans les espaces virtuels. Dans sa vidéo de présentation, Google montre que son intelligence artificielle peut vous aider à raisonner dans un jeu vidéo.

Ici, le jeu de stratégie mobile Clash of Clans est pris en exemple, lorsqu’un joueur demande à Gemini par quel côté il devrait attaquer la base ennemie. L’IA analyse l’écran, prend en compte les unités restantes du joueur et propose un plan d’attaque précis que l’utilisateur est libre de suivre ou pas.

Autant de fonctionnalités qui restent à ce jour hautement expérimentales, mais qui trouvent avec Gemini 2.0 un terreau fertile sur lequel se développer. Si les outils présentés par Google sont encore loin d’être déployés au grand public, la dernière version du LLM de la firme offre dans tous les cas des réponses plus pertinentes, plus rapides et des interactions plus réalistes avec les utilisateurs et les utilisatrices, notamment via Gemini Live.

À lire aussi

Article rédigé par
Pierre Crochart
Pierre Crochart
Journaliste