Actu

La fiabilité des sources citées par les IA interrogent

14 août 2025
Par Pierre Crochart
La fiabilité des sources citées par les IA interrogent
©Tada Images/Shutterstock

Si la citation des sources par les intelligences artificielles représente un bon argument de réassurance pour les internautes, il ne faudrait pas les prendre pour argent comptant.

Alors que rien ne semble en mesure d’arrêter le déploiement de l’intelligence artificielle à travers le monde, de plus en plus de personnes se tournent vers les chatbots comme ChatGPT, Gemini ou Perplexity pour effectuer leurs recherches en ligne. Une pratique dont les écueils ont déjà été documentés, et qu’une nouvelle étude remet une nouvelle fois en question. D’après le cabinet Ahrefs, spécialisé dans l’optimisation d’articles pour les moteurs de recherche, 90% des sources citées par les IA ne figurent pas dans le top 10 de Google et Bing.

À partir de
199€
En stock vendeur partenaire
Voir sur Fnac.com

Les IA citent leurs sources, mais pas forcément les bonnes

Citée par le Blog du Modérateur, cette étude passe à la loupe le fonctionnement de quatre IA très populaires : ChatGPT, Gemini, Copilot et Perplexity. Chacune propose à ses utilisateurs et utilisatrices d’effectuer des recherches sur le web, et listent systématiquement leurs sources afin de rassurer sur la provenance des informations, et d’encourager les internautes à poursuivre leurs recherches.

Seulement, en comparant la provenance de ses sources avec la première page des SERP (résultats issus d’un moteur de recherche pour une requête donnée), la data scientist Xibeijia Guan s’est aperçu qu’il y avait très peu de « chevauchement ». En d’autres termes, les IA utilisent très peu les sources jugées les plus fiables par les moteurs de recherche traditionnels.

En utilisant un corpus de 15 000 requêtes recouvrant des thématiques comme la nutrition ou les assurances dans plusieurs langues, la chercheuse rapporte que très exactement 10,96% des sources citées par les intelligences artificielles figurent dans les résultats de recherche les plus populaires sur Google ou Bing (le moteur de Microsoft).

Les meilleurs élèves de la recherche en ligne

Est-ce à dire que les IA racontent n’importe quoi ? Pas nécessairement — même si l’on connaît la propension de ces outils à « halluciner », c’est-à-dire à inventer des réponses plutôt que d’admettre leur méconnaissance. En fait, les paramètres du comportement de chaque intelligence artificielle peut expliquer cette forte disparité dans les sources citées. Pour être les plus exhaustives possibles, les IA décomposent votre requête en plusieurs sous-requêtes afin de saisir toute la complexité d’un problème donné. Cela donne naturellement lieu à des requêtes web parfois assez éloignées des termes exacts que vous avez saisi sur l’interface. Par ailleurs, l’historique d’échanges avec les chatbots entre aussi en jeu dans les sources que vont préférer citer les intelligences artificielles.

On peut tirer plusieurs enseignements de cette étude. D’abord, que la vigilance doit toujours être de mise lorsqu’on utilise l’IA pour chercher le web. Ensuite, qu’un bon positionnement dans les SERP n’est pas du tout synonyme de bonne exposition de son site web dans les réponses apportées par les IA. Malgré tout, voici d’après les trouvailles de Ahrefs quelles sont les IA qui collent les plus aux réponses de Google.

Recherches par IA par correspondance avec les moteurs de recherche traditionnels
Recherches par IA par correspondance avec les moteurs de recherche traditionnels.©Ahrefs

Perplexity serait donc l’intelligence artificielle qui cite le plus de sources en provenance de Google. Pas forcément étonnant : la startup utilise son propre robot d’indexage du web. Un « crawler » qui, d’ailleurs, ne semble pas faire grand cas des sites web qui lui refusent l’accès par opposition à l’intelligence artificielle.

À lire aussi

Article rédigé par
Pierre Crochart
Pierre Crochart
Journaliste
Pour aller plus loin