OpenAI pousse encore plus loin les capacités de ChatGPT avec une nouvelle fonction baptisée « Agent ». L’intelligence artificielle peut désormais envoyer des e-mails, générer un tableau Excel… sans que vous n’ayez à lever le petit doigt.
Et si ChatGPT ne se contentait plus de vous répondre, mais agissait pour vous, tout seul ? OpenAI vient de dévoiler « ChatGPT Agent », une fonctionnalité qui permet à l’intelligence artificielle d’aller bien au-delà du simple dialogue. En combinant la navigation web, l’exécution de code, l’accès aux API, la gestion des emails et la création de documents, l’agent agit dans un environnement virtuel sécurisé… mais potentiellement très intrusif.
Concrètement, avec Agent, le chatbot pense et agit, en exécutant des tâches complexes de bout en bout grâce à un « ordinateur » virtuel, un navigateur visuel, un terminal, des connexions à Gmail, Google Drive, GitHub, etc. Il peut réserver, faire des recherches, remplir des formulaires, coder, créer des présentations… S’il va toujours demander l’autorisation avant de faire des actions sensibles, il n’en demeure pas moins que Agent s’insère encore un peu plus dans votre vie et prend davantage le contrôle pour réaliser certaines actions.
Agent, une version dopée de ChatGPT qui agit au lieu de suggérer
Depuis le lancement de ChatGPT fin 2022, l’IA d’OpenAI a changé de visage à plusieurs reprises. D’abord capable de générer du texte, elle a vite intégré des fonctions d’analyse de données, de génération d’images, et même de pilotage d’outils tiers. Depuis ce mois-ci, avec ChatGPT Agent, elle franchit une nouvelle frontière : celle de l’autonomie. Fini les prompts suivis d’un copier-coller dans un autre logiciel. L’agent peut désormais planifier, chercher, cliquer, remplir des formulaires, générer des fichiers et même envoyer des emails – le tout à votre place.
Concrètement, il s’agit d’une fusion de deux outils maison : Operator, qui permettait déjà d’interagir avec des services web comme Google Calendar ou GitHub ; et Deep Research, pensé pour collecter et synthétiser des informations à grande échelle. Le tout est emballé dans une interface unifiée, dotée d’un « ordinateur virtuel » accessible directement depuis ChatGPT, via la commande « /agent » que l’on trouve dans l’onglet « outils » du champ de recherche du chatbot.
Un exemple ? Réserver un Uber pour aller de la gare au bureau
Petit scénario pour tester ChatGPT Agent : lundi matin, j’arrive en train à Paris Gare Montparnasse à 9 h et j’ai un rendez-vous au bureau une heure plus tard. Je demande à Agent de me réserver un VTC (en l’occurrence Uber) pour me rendre de la gare au bureau dans les temps.

Les horaires sont renseignés dans le calendrier de l’ordinateur. Première étape : ChatGPT demande à y avoir accès.

Ensuite, il se rend sur la page de connexion d’Uber et me demande de reprendre le contrôle afin que je renseigne identifiant et mot de passe.

Une fois chose faite, Agent reprend le contrôle et agit un peu comme une personne pas très douée qui utiliserait un ordinateur tout en commentant tout ce qu’elle fait. Par exemple, il a dû s’y reprendre à deux fois pour réussir à remplir le champ de départ (Gare Montparnasse). Ensuite, pour l’horaire, il y a un menu déroulant.

Agent m’indique « Les horaires sont proposés par paliers de 10 minutes, alors je vais continuer à descendre jusqu’à atteindre l’heure demandée. » Puis il précise : « J’ai déroulé trop vite, je suis arrivé à 11 h. Je vais remonter vers 9 h. » Agent finit par choisir « 9 h 10 » comme heure de rendez-vous, mais ce fut un peu laborieux. J’aurais sans doute mis le même temps, voire un peu moins avec l’appli déjà connectée. Mais je peux laisser Agent travailler en tâche de fond pendant que je fais autre chose.

Autre requête : sur une boîte mail sur laquelle je route la plupart des emails commerciaux et newsletters, je demande à Agent de faire un gros nettoyage. Ma requête est la suivante : « Je veux que tu supprimes tous les mails commerciaux (newsletters, promos) qui remontent à avant le 31 décembre 2024 de mon compte mail Yahoo ». Agent s’exécute une fois que j’ai pris la main pour me connecter au compte en question.

Là encore, il doit s’y reprendre à plusieurs fois, car il n’arrive pas à cliquer avec suffisamment de précision sur les liens et cases à cocher… Mais il finit par y arriver, me demande une dernière validation sur l’action à mener (supprimer 16 690 emails !) et exécute ma requête. Mieux : il a la patience que je n’ai pas pour attendre que tout soit transférer dans la corbeille avant de vérifier que la manœuvre a bien fonctionné. In fine, la mission a parfaitement été remplie.

À noter que, avant toute action dite « irréversible » (comme la réservation Uber), l’agent vous demande confirmation. Ce garde-fou, baptisée « Watch Mode », est là pour rassurer.
Un outil qui pourrait faire gagner du temps… mais à l’efficacité encore inégale
OpenAI assume que certaines tâches peuvent prendre du temps : entre 15 et 30 minutes pour générer un rapport complexe ou interagir avec plusieurs services. Pas de quoi s’inquiéter selon les créateurs de l’outil, qui estiment qu’il vaut mieux une tâche qui s’exécute en fond et vous rend un livrable prêt à l’emploi, plutôt qu’un clic immédiat sans valeur ajoutée.
Parmi les usages déjà testés avec succès : l’élaboration de tableaux Excel, l’analyse comparative de produits, la génération de visuels, la réservation d’un VTC et la gestion automatisée d’emails. Le tout sans codage, sans configuration technique, et accessible sur desktop comme sur mobile. Pour l’instant, seuls les abonnés Pro, Plus et Team peuvent l’activer, via le menu « Outils » ou la commande « /agent ».
Une IA multitâche… et multisources de données
ChatGPT Agent se distingue par sa capacité à jongler entre plusieurs outils : navigateur visuel, terminal en ligne de commande, connecteurs vers Gmail, SharePoint, Google Drive ou encore Google Calendar. Grâce à une orchestration interne intelligente, l’IA peut enchaîner les étapes d’un processus complexe : recherche d’informations, saisie dans un tableau, génération d’une présentation, envoi du fichier — le tout sans changer d’interface.
Cette puissance soulève toutefois des questions éthiques et pratiques. Qui contrôle réellement les données manipulées ? L’IA n’a-t-elle vraiment pas accès au mot de passe que je copie-colle dans son interface ? Peut-on faire confiance à une IA pour interagir avec autant de services sensibles ? Même si OpenAI jure avoir mis en place des protocoles de sécurité rigoureux, l’enjeu est moins technique que culturel : sommes-nous prêts à déléguer autant de responsabilités à un outil encore jeune ?
Délégation ou dépossession ?
L’un des attraits majeurs de cette nouvelle génération d’agents, c’est leur capacité à transformer des intentions floues en actions concrètes. Mais à force de tout déléguer – planning, veille concurrentielle, emails, organisation d’événements –, ne risque-t-on pas d’appauvrir notre autonomie ? Voire de perdre la main sur ce qui fait notre quotidien numérique ?
L’efficacité promise s’accompagne d’une dépendance potentielle. Et comme pour tout outil puissant, les mauvaises pratiques – prompts trop vagues, absence de relecture, partage de données sensibles – peuvent avoir des conséquences fâcheuses. Dans sa présentation de ce nouvel outil, OpenAI recommande ainsi de collaborer activement avec l’agent, d’interrompre ou de réorienter ses actions au besoin, et de désactiver les connecteurs non essentiels pour préserver la confidentialité.
Une révolution… ou une zone grise ?
Le lancement de ChatGPT Agent s’inscrit dans une tendance de fond. Depuis que Klarna a révélé, début 2024, que son propre agent IA gérait deux tiers des conversations clients, les géants du numérique s’empressent de suivre. Google a récemment racheté la start-up Windsurf pour muscler ses ambitions « agentiques », et Amazon, Meta ou Perplexity multiplient les annonces dans ce sens.
Mais cette course à l’autonomie ne doit pas faire oublier les risques. Des attaques par injection de prompt sur des sites malveillants ont déjà été recensées. Et malgré les protections mises en place, le simple fait qu’un outil puisse manipuler à la fois vos mails, vos fichiers et votre agenda mérite que l’on s’interroge.
Alors, êtes-vous prêt à donner à ChatGPT les clés de votre vie numérique ? L’agent est prometteur, fascinant… et un peu inquiétant. Comme souvent avec l’IA, tout dépendra de la manière dont nous l’utilisons – ou la laissons-nous utiliser.