
Google enrichit encore son IA Gemini avec des fonctionnalités loin d’être inédites, mais qui resserrent l’écart avec son grand rival de chez OpenAI.
Le géant du Web multiplie les annonces ces derniers jours. Après le coup d’envoi donné à son nouveau dernier modèle d’IA, Flash 2.0, Google lance aujourd’hui deux nouvelles fonctionnalités très attendues : la génération de podcasts et un outil collaboratif baptisé… Canvas. Oui, oui, exactement comme le Canva (sans « S ») de ChatGPT.
Un “espace interactif” dédié à la création
Canvas reprend donc le patronyme de la fonctionnalité de ChatGPT, mais aussi le gros de ses fonctionnalités. En clair, il s’agit d’un espace intégré à Gemini et donnant accès à une interface facilitant la création et l’édition de documents.
Plutôt que de chercher à faire comprendre à l’intelligence artificielle que l’on souhaite modifier tel ou tel passage, il suffit ici de sélectionner la partie qui ne convient pas et d’émettre un nouveau prompt. Exactement comme on le ferait sur un éditeur de texte pour reformuler une phrase.
Google présente son nouvel outil comme un espace dédié à la création, mais aussi à la « collaboration ». Bien que ce terme soit souvent associé à des logiciels permettant de travailler à plusieurs mains sur un même document, il s’agit bien ici de collaborer avec l’IA pour parvenir au meilleur résultat possible. Bien sûr, les créations issues de Canvas peuvent ensuite être exportées facilement vers Google Docs pour plus de commodités et pour finaliser le travail.
La fonctionnalité est disponible gratuitement auprès de tous les utilisateurs et les utilisatrices de Gemini (compte Google requis).
Des podcasts à partir de vos documents
Outre Canvas, Gemini accapare désormais une nouveauté directement issue de l’outil surpuissant NotebookLM, lequel susciterait un vif engouement auprès de la communauté scientifique.
Désormais, il est possible de demander à Gemini de générer un podcast entre deux hôtes virtuels rendant l’écoute d’un document plus digeste et dynamique. Il suffit de lancer une recherche via le modèle réflexif Deep Research, et ensuite de choisir l’option baptisée « Audio Overview » pour qu’un fichier audio soit créé en quelques minutes, résumant les points clés sous la forme d’une discussion entre deux personnes virtuelles. Bluffant.
Notez que les Audio Overviews fonctionnent également sur la base de documents (PDF, Word). On imagine déjà des lycéens écouter un podcast leur résumant ce qu’il y a à savoir sur leur lecture obligatoire du trimestre. Au détail près que, pour le moment, seul l’anglais est disponible pour cette fonctionnalité accessible gratuitement sur Gemini.