
La plateforme chinoise, en odeur de sainteté depuis quelques jours, continue d’agacer sa concurrence américaine avec un nouveau modèle de génération d’images.
On n’a pas fini d’entendre parler de DeepSeek, qui va clairement s’imposer comme l’une des startups de l’intelligence artificielle les plus fascinantes à suivre au long de l’année. Après avoir fait dégringoler la bourse américaine avec son modèle réflexif R1, voilà que l’entreprise chinoise dégaine Janus-Pro : une IA générative d’images ultraperfectionnée.
Une IA plus performante que Dall-E et Stable Diffusion XL
Pour l’heure uniquement disponible sur la plateforme Hugging Face, Janus-Pro-7B (de son nom complet), est une IA qui permet, au choix, d’analyser une image qu’on lui envoie ou alors d’en générer une nouvelle à partir d’un prompt. Un concurrent direct de Dall-E (OpenAI), donc, mais également de Stable Diffusion ou de Midjourney.
Comme pour ses modèles textuels V3 et R1, le code de Janus-Pro est publié sous licence MIT, libre, permettant à tout un chacun de se l’approprier et de le modifier pour le rendre plus performant pour ses besoins. Une différence majeure avec la plupart des IA du marché, qui fonctionnent en vase clos.
Mais l’intérêt de ce nouvel outil est pour l’heure assez limité. Il faut en effet utiliser une plateforme tierce pour le mobiliser, ce qui n’est pas le plus commode. Nul doute que DeepSeek finira cependant par intégrer Janus à son application smartphone pour plus de commodité.
DeepSeek se fait déjà une place
Dans la foulée de ses annonces qui agacent particulièrement les grandes entreprises tech américaines en raison de la relative efficience de ses modèles (une requête DeepSeek R1 coûterait 27 fois moins cher qu’une équivalente sous ChatGPT-o1), certaines commencent déjà à brosser DeepSeek dans le sens du poil.
C’est notamment le cas de Perplexity, l’IA qui navigue le Web à votre place. La startup a annoncé hier que DeepSeek V3 rejoignait le rang des différentes IA mobilisables lors d’une recherche, aux côtés de ChatGPT. En particulier, c’est le modèle R1, dédié au raisonnement, qui est utilisé ici et qui permettra donc à l’IA d’expliquer étape par étape la façon dont elle a procédé pour vous fournir les résultats affichés à l’écran.

On notera que la startup américaine cherche à rassurer ses utilisateurs quant à la nationalité de DeepSeek – une entreprise chinoise, ce qui n’est pas très bien vu aux États-Unis en ce moment. Profitant du caractère ouvert du modèle publié par DeepSeek, Perplexity annonce que les requêtes effectuées par son biais voient leurs données hébergées aux États-Unis.