ChatGPT-4o, Google Gemini, Claude enfin disponible en Europe… découvrez les dernières actus en matière d’IA dans le monde.
Il ne se passe pas un jour sans que le monde de l’intelligence artificielle ne bruisse d’une nouvelle annonce. Chaque jour, ou presque, les géants du secteur (OpenAI, Google, Meta, Midjourney, Anthropic…) dévoilent des avancées. Le 13 mai dernier, OpenAI a ainsi présenté GPT-4 Omni – surnommé GPT-4o –, une nouvelle version de son bot d’IA générative conversationnelle. Cette nouvelle mouture est capable de fournir des réponses nettement plus rapides et plus fiables grâce à sa meilleure mémoire, y compris à partir de fichiers audio, vidéo ou de textes. Seul bémol : les « hallucinations » (réponses fausses) demeurent et sont de plus en plus difficiles à identifier.
À lire aussi
La bonne nouvelle est que cette version est aussi disponible gratuitement. Plus besoin de payer les 20 dollars mensuels d’abonnement pour avoir accès à ChatGPT-4, qui plus est en version plus rapide. Pourquoi une telle décision de la part d’OpenAI ? La firme de Sam Altman a très clairement voulu répondre au plus vite aux dernières avancées de Google en matière d’IA.
Google : Gemini, une IA trois-en-un
Présentées lors de l’événement annuel Google I/O, les nouvelles concernant Gemini sont multiples. Il y a tout d’abord la version pro qui est désormais capable de gérer encore plus de données. L’outil peut résumer jusqu’à 1 500 pages de texte téléchargées par les utilisateurs, facilitant ainsi le traitement de gros volumes d’informations. Il a également gagné en capacités de génération de code, compréhension multimodale et raisonnement logique. Résultat : Gemini 1.5 Pro comprend des instructions plus complexes et nuancées.
La version Flash, elle, est une itération légèrement allégée, mais qui garde sa vélocité et supporte l’input d’images, de vidéos et de sons. On peut dire que c’est un outil efficace pour des tâches assez simples comme résumer un document. Enfin, la version Gemini Nano est un modèle léger qui sera bientôt embarqué en local dans le smartphone Google Pixel avec une bonne compréhension des images. Il viendra remplacer Google Assistant. À noter aussi que Gemini parle désormais 35 langues et dispose d’une appli.
Enfin, moins bonne nouvelle pour l’expérience « AI Overviews ». Ces résumés d’une page web réalisés grâce à Gemini devaient accélérer nos recherches en s’affichant directement dans la page de résultats. Déployée aux États-Unis depuis le 14 mai 2024, la fonction apparaissait initialement sur 84 % des requêtes. Mais début juin, face au trop grand nombre de réponses erronées, ce ne sont plus que 15 % des recherches qui sont désormais concernées. Oups…
Très attendu, Claude débarque en Europe
Sous ce nom, atypique pour une solution tech, se cache une IA elle aussi atypique. Développée par Anthropic, Claude se veut « utile, honnête et inoffensif ». Jusqu’à présent, il était compliqué de pouvoir l’utiliser sans être basé aux États-Unis. Mais, depuis la mi-mai, Claude 3 est librement accessible sur le Vieux Continent. Cette troisième itération de l’IA attise toutes les curiosités, car elle fait réellement jeu égal avec les capacités de ChatGPT. Claude s’est rapidement démarqué grâce à son excellente compréhension du langage naturel, sa génération de textes de qualité et son raisonnement logique poussé.
En outre, au-delà de ses performances techniques, Claude se distingue aussi par son fort engagement éthique. Anthropic a en effet formé son modèle de langage avec un cadre déontologique strict, visant à promouvoir des valeurs comme l’honnêteté, l’intégrité et le respect des droits humains. Claude refuse ainsi de produire du contenu haineux, discriminatoire ou illégal. De plus, l’assistant affiche une grande transparence en expliquant ses raisonnements et en reconnaissant ses limites. Cette approche éthique et responsable a donc de quoi séduire.
Et aussi… les news de l’IA en vrac
Midjourney
Les utilisateurs assidus (plus de 100 images générées) peuvent désormais utiliser la version « site web » et s’affranchir de Discord. Il existe une nouvelle fonction « salles » permettant de créer en temps réel avec des personnes du monde entier. Depuis le 18 mai, certains ont même la possibilité de disposer de « salles privatives » pour n’y convier que des amis ou des collègues. Enfin, le 8 juin, Midjourney a annoncé la mise à jour de Niji V6 (le générateur d’images à l’esthétique anime et orientale). Quoi de neuf ? Le rendu des caractères japonais et chinois est grandement amélioré.
Microsoft
Le 20 mai dernier, la firme de Redmond a présenté une toute nouvelle catégorie de PC Windows optimisés pour l’IA. Nommés Copilot+, ces PC embarquent un nouveau processeur plus rapide et plus puissant pour faciliter l’usage de l’intelligence artificielle. Cela concerne les nouveaux appareils Microsoft Surface mais aussi des machines d’autres marques (Acer, ASUS, Dell, HP, Lenovo et Samsung).
Apple
La marque à la pomme a dévoilé lundi 10 juin son nouveau service d’intelligence artificielle, Apple Intelligence, qui sera intégré dans iOS 18, iPadOS 18 et macOS 15. Ce service proposera des fonctionnalités avancées d’IA, telles que la reconnaissance contextuelle et l’amélioration de la sécurité grâce à la reconnaissance faciale pour verrouiller les applications. Si cela fonctionne mieux que le Siri actuel, ce sera une réussite !