Actu

Tout ce qu’il faut savoir sur Gemini, la riposte de Google à GPT-4 d’OpenAI

07 décembre 2023
Par Kesso Diallo
Google affirme que son modèle égale ou surpasse les performances de GPT-4, selon les tâches.
Google affirme que son modèle égale ou surpasse les performances de GPT-4, selon les tâches. ©rafapress / Shutterstock

Ce modèle multimodal se décline en trois versions, dont l’une, Gemini Pro, alimente désormais Bard, le robot conversationnel de Google. La version la plus puissante, Gemini Ultra, sera disponible début 2024.

Après avoir revu ses plans, Google vient de dévoiler Gemini, son modèle d’intelligence artificielle (IA) pour concurrencer celui d’OpenAI, GPT-4. Décrit comme son « modèle le plus performant et le plus général à ce jour » par son PDG, Sundar Pichai, il a été développé par les laboratoires de recherche sur l’IA de la firme, DeepMind et Brain, fusionnés en avril dernier.

Intégration dans les produits et services de Google

Gemini est un modèle multimodal, signifiant qu’il est capable de comprendre différents types d’informations, tels que le texte, les images, le son ou encore le code informatique. Il se décline en trois versions : Nano, Pro et Ultra. La première, conçue pour les tâches sur smartphone, est d’ailleurs déjà disponible sur le Pixel 8 Pro, offrant de nouvelles fonctionnalités à ses propriétaires. 

La seconde, qui est la version intermédiaire, alimente désormais Bard, le chatbot de Google. « Il s’agit de la plus grande mise à jour de Bard depuis son lancement », a déclaré Demis Hassabis, PDG de DeepMind, dans un communiqué. Grâce à Gemini Pro, le robot conversationnel devrait en effet disposer de capacités de raisonnement, de planification et de compréhension plus avancés. Cette version sera également disponible pour les développeurs et les entreprises à partir du 13 décembre, via l’interface de programmation d’application Gemini dans Google AI Studio et Google Cloud Vertex AI. 

Gemini Ultra est, elle, la version la plus grande et la plus performante du modèle, destinée aux tâches très complexes. Elle ne sera disponible qu’au début de l’année prochaine, Google indiquant « effectuer des contrôles approfondis de confiance et de sécurité (…) avant de la rendre largement disponible ». Début 2024, la société prévoit aussi de lancer Bard Advanced, « une nouvelle expérience d’IA de pointe qui vous donne accès à nos meilleurs modèles et capacités, à commencer par Gemini Ultra ». Dans les prochains mois, elle va aussi intégrer Gemini dans plusieurs de ses produits et services, dont son moteur de recherche et son navigateur web.

Un modèle plus puissant que GPT-4

Google affirme que les son modèle égale ou surpasse les performances de GPT-4, selon les tâches. « De la compréhension naturelle des images, de l’audio et de la vidéo au raisonnement mathématique, les performances de Gemini Ultra dépassent les résultats de pointe actuels sur 30 des 32 références académiques largement utilisées dans la recherche et le développement de grands modèles de langage (LLM) », a affirmé Demis Hassabis. Il a par exemple obtenu un score de 90% – contre 86,4% pour GPT-4 – pour la compréhension massive du langage multitâche (combinaison de 57 matières, dont les mathématiques, la physique et l’histoire pour tester à la fois les connaissances du monde et les capacités de résolution de problèmes). 


Avec ses capacités de raisonnement, Gemini serait également capable de réfléchir plus attentivement avant de répondre à des questions difficiles et de donner un sens à des informations écrites et visuelles complexes. Enfin, Google assure avoir ajouté de nouvelles protections à son modèle face aux dangers de cette technologie (biais, toxicité…). « À chaque étape du développement, nous prenons en compte les risques potentiels et nous efforçons de les tester et de les atténuer », a indiqué Demis Hassabis. Souhaitant rivaliser avec OpenAI, la firme rappelle ainsi qu’elle veut faire progresser l’IA en se montrant « audacieuse et responsable ».

À lire aussi

Article rédigé par
Kesso Diallo
Kesso Diallo
Journaliste