Actu

Google lance un nouveau modèle d’IA locale et deux applis pour l’essayer tout de suite

05 juin 2026

Par Pierre Crochart

Illustration
©Google

Le géant du Web enrichit son catalogue de modèles de langage locaux et facilite la procédure d’installation. Prêts à quitter le cloud ?

Introduction

Quelques jours après le lancement de son dernier LLM Gemini 3.5, Google dévoile Gemma 4 12B. Il s’agit d’un nouveau modèle d’IA locale, dernier rejeton de la famille Gemma 4 lancée début avril. Polyvalent, tout en restant relativement léger, il pourrait répondre à de nombreux cas d’usage sans avoir besoin de recourir à une solution web payante.

Un nouveau modèle multimodal local

Jusqu’ici, Gemma 4 faisait le grand écart entre des modèles très légers, adaptés aux ordinateurs peu puissants ou aux smartphones (les versions 2B et 4B), et d’autres aux capacités étendues, mais demandant une capacité de calcul trop importante pour de nombreux appareils domestiques (26B et 31B). Aujourd’hui, Google lance donc Gemma 4 12B Unified, un modèle qui vient s’intercaler à peu près au milieu, et qui recoupe – comme son nom l’indique – 12 milliards de paramètres.

Sa particularité nous est teasée par son nom complet. « Unified » signifie que Gemma 4 12B est capable de traiter et générer à la fois du texte, mais aussi du son, de l’image et même de la vidéo. Autrement dit, on peut partager à ce nouveau modèle tout type de document et l’interroger comme on le ferait, en ligne, avec Gemini. La différence, c’est qu’ici, tout se fait localement, sur votre ordinateur, hors ligne. Cela a non seulement des avantages en termes de confidentialité (personne ne peut lire vos prompts), mais aussi en consommation énergétique. C’est votre machine qui fait tourner l’IA, pas un serveur distant très gourmand.

Naturellement, Gemma 4 12B est extrêmement dépendant de la puissance de la machine qui l’accueille. Un MacBook avec une puce M5 Max offrira de bien meilleurs résultats qu’un ordinateur portable Lenovo vendu 500 €. Pour autant, tout le monde devrait y trouver son compte, pour peu qu’on réponde aux spécificités techniques demandées par Google : 16 Go de VRAM au moins, ou de la mémoire unifiée équivalente. Autant dire que ça fait déjà un sacré tri.

Comment essayer Gemma 4 12B dès maintenant ?

Voilà des années que l’on peut installer, localement, des modèles d’IA de Google, mais aussi de DeepSeek, d’AliBaba, de Meta et autres, grâce à des logiciels spécialisés comme LM Studio ou Ollama. Sur smartphone, l’application Locally AI est souvent citée comme étant la meilleure du genre. Mais, pour accompagner la sortie de Gemma 12B et faciliter la vie des utilisateur·ices, Google lance aussi deux nouvelles applications, pour l’heure exclusives à macOS : Google AI Edge Gallery et Google AI Edge Eloquent.

La première se présente comme une alternative à LM Studio. Elle permet d’installer localement des modèles d’IA comme Gemma 4 et de discuter avec, comme on le ferait avec n’importe quel chatbot – toujours localement. Avec la rubrique Agent Skills, on peut également demander à l’IA d’agir sur des documents, de créer du code et bien d’autres choses.

Eloquent, elle, est une application de dictée vocale perfectionnée par IA. Pour l’heure, elle n’est toutefois disponible qu’en anglais, mais elle permet en tout cas de retranscrire vos paroles en texte, tout en retirant vos hésitations, tics de langage et autres afin de le fluidifier. Des applications également disponibles sur iOS et Android pour les emporter partout avec soi.

À lire aussi

Article rédigé par

Journaliste