Comment suivre le trafic IA (ChatGPT, Perplexity, Gemini) en 2026

Pour la plupart des sites, le trafic issu des assistants IA représente encore environ 1 % des visites. Ce chiffre est facile à balayer, et la plupart des équipes le font. C'est aussi le mauvais chiffre à regarder, pour deux raisons : il croît vite, et les visiteurs qui le composent convertissent à des taux plus proches du référencement payant que de l'organique. Le canal est petit, à forte intention, et presque entièrement mal mesuré.

La mauvaise mesure, c'est la vraie histoire. Plusieurs études de 2026 estiment qu'environ 70 % des sessions référées par l'IA arrivent sans en-tête de référent. Ces sessions n'apparaissent pas comme « ChatGPT » ou « Perplexity » dans vos rapports. Elles atterrissent dans Direct, mêlées aux favoris et aux URLs tapées, et le canal a l'air de n'être rien. Si vous jugez le trafic IA d'après ce que votre tableau de bord étiquette comme IA, vous n'en voyez qu'une fraction.

Ce guide explique ce qu'est réellement le trafic IA, pourquoi il se cache, comment suivre la partie traçable et comment raisonner sur celle qui ne l'est pas.

D'abord, séparez les crawlers des visiteurs

L'expression « trafic IA » désigne deux choses complètement différentes, et les confondre est l'erreur la plus courante.

Les crawlers IA sont des bots qui récupèrent vos pages pour entraîner des modèles ou construire un index de recherche : GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot, Google-Extended. Ils apparaissent dans vos logs serveur, pas dans vos analytics, et ce ne sont pas des gens. Une forte activité de crawl signifie que les modèles vous lisent. Elle ne signifie pas que quelqu'un a visité.
Le trafic référé par l'IA est un humain qui a posé une question à un assistant, a vu votre site cité ou lié dans la réponse, et a cliqué. C'est un vrai visiteur avec une vraie intention, et c'est le trafic qui vaut la peine d'être mesuré.

Être cité par un assistant (côté crawler) et être cliqué depuis cette citation (côté visiteur) sont deux résultats différents. Une étude a montré que seules 12 à 18 % des citations de Perplexity se transforment en clic réel. Être mentionné n'est pas être visité, et vos analytics ne voient jamais que les visites.

Deux colonnes séparées par un signe différent. À gauche : les crawlers IA (GPTBot, PerplexityBot, ClaudeBot, Google-Extended) alimentent les logs serveur, jamais vos analytics, avec la mention « ils vous lisent, personne n'a visité ». À droite : les visiteurs référés par IA, de vrais humains qui interrogent un assistant, voient une citation et cliquent, alimentent vos analytics comme une vraie visite. Une note indique : être cité n'est pas être visité, seules 12 à 18 % des citations deviennent un clic — Les crawlers touchent vos logs serveur et n'apparaissent jamais dans les analytics ; seuls les humains qui cliquent sur une citation deviennent des visites mesurables — et seule une fraction des citations se transforme en clic.

Pourquoi le trafic IA se cache dans Direct

Quand un navigateur suit un lien, il envoie généralement un en-tête de référent indiquant à votre site d'où vient le clic. C'est grâce à cet en-tête que n'importe quel outil d'analytics étiquette une visite comme « google », « chatgpt.com », etc.

Les assistants IA cassent ce mécanisme de plusieurs façons :

Beaucoup de réponses sont lues dans une application mobile ou un client de bureau, pas dans un onglet de navigateur. Le passage de l'app au navigateur supprime souvent le référent.
Certains assistants le suppriment délibérément. L'AI Mode de Google, par exemple, utilise un attribut noreferrer sur ses liens, ce qui rend ce trafic intraçable dans tout outil d'analytics côté client.
Les réglages de confidentialité et les wrappers de liens retirent ou réécrivent les référents en chemin.

Résultat : une large part des vraies visites IA arrivent sans source attachée et sont rangées dans Direct. Ce n'est pas un défaut d'un seul outil. Cela touche toutes les plateformes d'analytics côté client de la même façon, y compris GA4, y compris celles axées sur la confidentialité. Aucun outil ne peut étiqueter un référent que le navigateur n'a jamais envoyé.

Un flux montrant un visiteur qui clique sur un lien cité dans une réponse IA, le référent supprimé en chemin par trois causes (passage app-navigateur, noreferrer, wrappers de liens et confidentialité), et la visite qui atterrit dans le panier Direct de GA4, mêlée aux favoris et aux URLs tapées, où elle est désormais masquée — Le référent est supprimé en chemin, donc une visite IA à forte intention atterrit dans Direct, indiscernable d'un favori. Environ 70 % du trafic IA arrive ainsi.

Ce que cela signifie en pratique : votre chiffre « IA » rapporté est un plancher, pas le chiffre réel. La façon honnête de parler du canal est « au moins autant », jamais « exactement autant ».

Les sources IA à surveiller

Pour les sessions qui portent bien un référent, voici les domaines qui représentent la quasi-totalité du trafic IA mesurable en 2026 :

Assistant	Domaines référents
ChatGPT	chatgpt.com, chat.openai.com, openai.com
Google Gemini	gemini.google.com, bard.google.com
Claude	claude.ai
Perplexity	perplexity.ai
Microsoft Copilot	copilot.microsoft.com, bing.com/chat
Autres	chat.mistral.ai, deepseek.com, grok.com, meta.ai, you.com

La distribution évolue constamment. ChatGPT domine toujours les référencements mesurables mais sa part est passée de plus de 85 % il y a un an à un peu plus de 60 % en 2026, tandis que Claude, Gemini et Perplexity ont tous gagné du terrain. Les moteurs régionaux comptent aussi : si une grande partie de votre audience est en France ou en Europe, le Vibe de Mistral (anciennement Le Chat ; chat.mistral.ai) a sa place dans votre liste aux côtés des acteurs mondiaux. Quelle que soit la liste que vous construisez, prévoyez de la revoir chaque trimestre, car le classement change vraiment vite.

Suivre le trafic IA dans GA4

Le 13 mai 2026, GA4 a ajouté un canal natif « AI Assistant » à son groupe de canaux par défaut, déployé largement sur l'ensemble des propriétés début juin. Quand un clic correspond à un assistant connu, GA4 l'étiquette désormais automatiquement (medium ai-assistant, canal AI Assistant) sans configuration. C'est une vraie amélioration, mais trois pièges comptent avant de s'y fier :

La liste reconnue n'est publiée qu'à titre d'exemples. Google cite ChatGPT, Gemini, Deepseek, Copilot et Grok, mais qualifie la liste de non exhaustive et garde la liste complète de référents privée, donc la documentation seule ne peut pas dire comment un assistant donné est classé. En pratique, Perplexity est largement signalé comme atterrissant toujours dans Referral, et Claude, nommé au lancement mais absent de la liste publiée actuelle, est dans la même zone grise. Google route aussi ses propres clics AI Overviews et AI Mode vers Organic Search, pas vers AI Assistant. Le seul moyen d'en être certain pour une source qui compte pour vous est de vérifier vos propres rapports GA4 : filtrez par cette source et regardez son canal attribué.
Ce n'est pas rétroactif. Le canal ne classe le trafic qu'à partir du 13 mai 2026. Chaque visite IA antérieure reste enfouie dans Referral ou Direct selon vos anciens regroupements, donc la tendance historique n'est jamais reconstruite.
Il hérite du problème de référent. Comme toute règle côté client, il ne capte que les sessions arrivées avec un référent intact, donc la majorité sans référent tombe quand même dans Direct.

Plutôt que de deviner ce que fait la liste privée et mouvante de Google, construisez un groupe de canaux personnalisé en filet de sécurité qui capte par leur nom tous les assistants qui vous intéressent :

Ouvrez Admin → Affichage des données → Groupes de canaux et créez un nouveau groupe.
Ajoutez un canal (par exemple « Trafic IA ») avec une condition où la Source correspond à une regex des domaines ci-dessus :
chatgpt\.com|chat\.openai\.com|openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|bard\.google\.com|copilot\.microsoft\.com|bing\.com/chat|chat\.mistral\.ai|deepseek\.com|grok\.com|meta\.ai|you\.com
Faites glisser le canal IA au-dessus de Referral dans la liste, puis enregistrez.
Revoyez la regex chaque trimestre à mesure que de nouveaux assistants apparaissent.

Comment fonctionne la regex. Le | signifie « ou », donc la règle dit à GA4 : si la source est chatgpt.com ou perplexity.ai ou chat.mistral.ai, et ainsi de suite, classe la visite sous Trafic IA. Le \. échappe chaque point pour qu'il soit lu comme un point littéral, pas comme un joker de regex.

Règles de canaux GA4 lues de haut en bas : une visite depuis chatgpt.com correspond à la règle 3, Trafic IA (surlignée), donc la règle gagne. La règle 4, Référent, est en dessous et n'est jamais atteinte. Une note indique : placez Trafic IA au-dessus de Référent, la première correspondance gagne, donc Référent ne voit jamais la visite — GA4 lit les règles de canaux de haut en bas et s'arrête à la première correspondance. Une visite depuis chatgpt.com est techniquement un référent, donc si Referral est au-dessus de votre règle IA, il capte la visite en premier. Placer Trafic IA au-dessus de Referral laisse votre règle gagner avant que le panier générique ne l'avale.

La limite que la regex ne contourne pas. Elle ne capte que les sessions arrivant avec un référent. Environ 70 % des visites IA arrivent sans, et tombent dans Direct, donc même un groupe de canaux parfait ne voit que le tiers visible environ du canal. La regex capture ce qui est étiqueté ; elle ne peut pas récupérer ce que le navigateur n'a jamais envoyé.

Ça vaut donc le coup, mais traitez-le comme un correctif partiel : c'est une règle manuelle à maintenir, et dans GA4 elle repose sur une plateforme qui échantillonne déjà vos rapports dès que les volumes augmentent. Un canal qui pèse 1 % du trafic est exactement le genre de petit segment que l'échantillonnage arrondit jusqu'à le faire disparaître.

Estimer la partie invisible

Puisque l'essentiel du trafic IA atterrit dans Direct, la question devient : comment estimer la portion cachée sans deviner ? Trois signaux aident à la trianguler :

Le trafic Direct vers les pages profondes. Personne ne tape ni ne met en favori l'URL d'un long article ou d'une page produit de niche. Une hausse du Direct atterrissant sur des pages profondes et spécifiques (plutôt que sur la page d'accueil) est très souvent du trafic IA et de recherche non attribué. Segmentez le Direct par page d'atterrissage et surveillez les pages profondes.
La hausse des recherches de marque. Les gens qui vous découvrent dans une réponse IA recherchent souvent ensuite votre nom de marque pour vérifier. Une montée des requêtes de marque qui suit les mentions IA est un signal indirect mais réel.
Les logs serveur. Les visites de crawlers GPTBot, PerplexityBot et ClaudeBot vous disent quelles pages les modèles lisent. Cela ne mesure pas les visites, mais cela indique où des citations sont probablement générées, que vous pouvez recouper avec les pics de Direct sur ces mêmes URLs.

Aucun de ces signaux n'est exact. Ensemble, ils transforment « on n'en a aucune idée » en une estimation défendable, ce qui est le maximum qu'une mesure honnête de ce canal puisse offrir aujourd'hui.

Pourquoi ce canal mérite l'attention

Il serait raisonnable d'ignorer un canal à 1 % si ces visites se comportaient comme les autres. Ce n'est pas le cas. À travers les études de 2026, les visiteurs référés par l'IA convertissent systématiquement bien au-dessus de la recherche organique, avec des taux de conversion de l'ordre du référencement payant et un temps passé nettement supérieur à l'organique typique. L'intuition derrière est simple : quelqu'un qui arrive depuis une réponse IA a déjà eu sa question cadrée et en partie répondue, il atterrit donc plus bas dans l'entonnoir de décision qu'un chercheur à froid.

Un graphique en barres comparant le taux de conversion par canal : la recherche organique est basse, tandis que la référence IA et la recherche payante sont toutes deux bien plus hautes et au même niveau, avec l'annotation « même niveau » — Les visiteurs référés par l'IA convertissent au même niveau que la recherche payante et bien au-dessus de l'organique, parce qu'ils arrivent avec leur question déjà cadrée.

C'est pourquoi la fuite vers Direct coûte cher. Quand des visites IA à forte intention sont mal attribuées à Direct, deux choses tournent mal en même temps. Vous sous-estimez le travail qui gagne les citations IA (votre contenu, votre SEO, votre modèle d'attribution), et vous surestimez Direct, qui devient un fourre-tout masquant votre nouveau canal le plus performant. Le canal est assez petit pour être ignoré et assez précieux pour que l'ignorer soit une erreur.

Comment Sublim gère le trafic IA

Sublim capture le référent complet sur chaque événement et le classe automatiquement dans un canal d'acquisition, donc les visites depuis ChatGPT, Perplexity, Claude et les autres apparaissent comme leur propre source d'emblée, sans regex personnalisée à construire ou maintenir. Parce que Sublim n'échantillonne jamais, un canal à 1 % est rapporté en pleine résolution au lieu d'être arrondi jusqu'au bruit, ce qui compte précisément parce que le trafic IA est petit et croissant.

Ce que Sublim ne peut pas faire, et qu'aucun outil côté client ne peut faire, c'est inventer un référent que le navigateur n'a jamais envoyé. La portion sans référent est une limite dure du web, pas d'un produit en particulier. Là où Sublim aide, c'est sur le reste du problème : faire ressortir proprement le trafic IA traçable, vous laisser segmenter le comportement de ces visiteurs pour voir s'ils convertissent, et vous donner la vue Direct-par-page-d'atterrissage dont vous avez besoin pour estimer la part cachée. Vous mesurez précisément ce qui est mesurable, et vous raisonnez sur le reste avec de vrais signaux plutôt qu'avec une estimation échantillonnée.

Suivez votre trafic IA avec précision

Sans échantillonnage ni configuration — Sublim le détecte d'emblée.

En résumé

Le trafic IA est petit aujourd'hui, mal mesuré partout, et vaut plus par visite que presque n'importe quel autre canal. Trois actions vous mettent en avance : séparez les crawlers des vrais visiteurs pour ne pas célébrer des bots, étiquetez proprement les sources IA traçables au lieu de les laisser pourrir dans Direct, et construisez une estimation défendable de la part sans référent à l'aide du Direct sur pages profondes, des recherches de marque et des logs serveur. Faites-le et vous verrez le canal croître pendant que vos concurrents se demandent encore si 1 % vaut une réunion.

Comment suivre le trafic IA depuis ChatGPT, Perplexity et Gemini

D'abord, séparez les crawlers des visiteurs

Pourquoi le trafic IA se cache dans Direct

Les sources IA à surveiller

Suivre le trafic IA dans GA4

Estimer la partie invisible

Pourquoi ce canal mérite l'attention

Comment Sublim gère le trafic IA

En résumé

Articles similaires

L'échantillonnage des données Google Analytics expliqué : pourquoi vos rapports sont des estimations

Meilleure alternative à Google Analytics en 2026 : 7 outils comparés

Prêt à essayer Sublim ?