Como rastrear o tráfego de IA (ChatGPT, Perplexity, Gemini) em 2026

Para a maioria dos sites, o tráfego dos assistentes de IA ainda ronda 1% do total de visitas. É um número fácil de descartar, e a maioria das equipas fá-lo. Também é o número errado para olhar, por duas razões: cresce depressa, e os visitantes por trás convertem a taxas mais próximas da pesquisa paga do que da orgânica. O canal é pequeno, de alta intenção e quase totalmente mal medido.

A má medição é a verdadeira história. Vários estudos de 2026 situam em cerca de 70% a fração de sessões de referência de IA que chegam sem cabeçalho referrer. Essas sessões não aparecem como «ChatGPT» ou «Perplexity» nos teus relatórios. Caem em Direct, misturadas com favoritos e URLs digitados, e o canal parece não ser nada. Se julgares o tráfego de IA pelo que o teu painel rotula como IA, vês apenas uma fração.

Este guia explica o que é realmente o tráfego de IA, porque se esconde, como rastrear a parte rastreável e como raciocinar sobre a parte que não o é.

Primeiro, separa os crawlers dos visitantes

A expressão «tráfego de IA» é usada para duas coisas completamente diferentes, e confundi-las é o erro mais comum.

Os crawlers de IA são bots que recolhem as tuas páginas para treinar modelos ou construir um índice de pesquisa: GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot, Google-Extended. Aparecem nos logs do teu servidor, não na tua analítica, e não são pessoas. Muita atividade de crawling significa que os modelos te estão a ler. Não significa que alguém visitou.
O tráfego de referência de IA é um humano que fez uma pergunta a um assistente, viu o teu site citado ou ligado na resposta e clicou. É um visitante real com intenção real, e é o tráfego que vale a pena medir.

Ser citado por um assistente (o lado do crawler) e ser clicado a partir dessa citação (o lado do visitante) são resultados diferentes. Um estudo concluiu que apenas 12–18% das citações da Perplexity se transformam num clique real. Ser mencionado não é o mesmo que ser visitado, e a tua analítica só vê as visitas.

Duas colunas separadas por um sinal de diferente. À esquerda: os crawlers de IA (GPTBot, PerplexityBot, ClaudeBot, Google-Extended) vão para os logs do servidor, nunca para a tua analítica, com a nota «leem-te, ninguém visitou». À direita: visitantes de IA, humanos reais que perguntam a um assistente, veem uma citação e clicam, vão para a tua analítica como uma visita real. Uma nota diz: ser citado não é ser visitado, só 12 a 18 por cento das citações viram um clique — Os crawlers atingem os logs do teu servidor e nunca aparecem na analítica; só os humanos que clicam numa citação se tornam visitas mensuráveis — e só uma fração das citações vira um clique.

Porque o tráfego de IA se esconde em Direct

Quando um navegador segue uma ligação, normalmente envia um cabeçalho referrer que diz ao teu site de onde veio o clique. É através desse cabeçalho que qualquer ferramenta de analítica rotula uma visita como «google», «chatgpt.com», etc.

Os assistentes de IA quebram isto de várias formas:

Muitas respostas são lidas dentro de uma app móvel ou de um cliente de desktop, não num separador do navegador. A passagem da app para o navegador perde frequentemente o referrer por completo.
Alguns assistentes removem-no de propósito. O AI Mode da Google, por exemplo, usa um atributo noreferrer nas suas ligações, o que torna esse tráfego não rastreável em qualquer ferramenta de analítica do lado do cliente.
As definições de privacidade e os wrappers de ligações removem ou reescrevem os referrers pelo caminho.

O resultado: uma grande parte das visitas de IA reais chega sem fonte anexada e é catalogada em Direct. Não é uma falha de uma única ferramenta. Afeta de igual modo todas as plataformas de analítica do lado do cliente, incluindo o GA4, incluindo as orientadas para a privacidade. Nenhuma ferramenta consegue rotular um referrer que o navegador nunca enviou.

Um fluxo que mostra um visitante a clicar numa ligação citada numa resposta de IA, o referrer perdido pelo caminho por três causas (passagem app-navegador, noreferrer, wrappers de ligações e privacidade), e a visita a cair no balde Direct do GA4, misturada com favoritos e URLs digitados, onde fica agora oculta — O referrer é removido pelo caminho, por isso uma visita de IA de alta intenção cai em Direct, indistinguível de um favorito. Cerca de 70% do tráfego de IA chega assim.

O que isto significa na prática: o teu número «IA» reportado é um piso, não o valor real. A forma honesta de falar do canal é «pelo menos isto», nunca «exatamente isto».

As fontes de IA que vale a pena vigiar

Para as sessões que trazem referrer, estes são os domínios que representam quase todo o tráfego de referência de IA mensurável em 2026:

Assistente	Domínios referrer
ChatGPT	chatgpt.com, chat.openai.com, openai.com
Google Gemini	gemini.google.com, bard.google.com
Claude	claude.ai
Perplexity	perplexity.ai
Microsoft Copilot	copilot.microsoft.com, bing.com/chat
Outros	chat.mistral.ai, deepseek.com, grok.com, meta.ai, you.com

A distribuição muda constantemente. O ChatGPT continua a liderar as referências mensuráveis, mas a sua quota caiu de mais de 85% há um ano para pouco mais de 60% em 2026, enquanto Claude, Gemini e Perplexity ganharam terreno. Os motores regionais também contam: se grande parte do teu público está em França ou na Europa, o Vibe da Mistral (antes Le Chat; chat.mistral.ai) merece um lugar na tua lista ao lado dos players globais. Seja qual for a lista que construas, planeia revê-la todos os trimestres, porque o ranking muda mesmo assim tão depressa.

Rastrear o tráfego de IA no GA4

A 13 de maio de 2026, o GA4 adicionou um canal nativo «AI Assistant» ao seu grupo de canais predefinido, com ampla disponibilidade em todas as propriedades no início de junho. Quando um clique corresponde a um assistente conhecido, o GA4 rotula-o agora automaticamente (medium ai-assistant, canal AI Assistant) sem configuração. É uma melhoria real, mas há três senões que importam antes de confiar nela:

A lista reconhecida só é publicada como exemplos. A Google nomeia ChatGPT, Gemini, Deepseek, Copilot e Grok, mas chama à lista não exaustiva e mantém privada a lista completa de referrers, por isso a documentação por si só não te diz como é classificado um dado assistente. Na prática, a Perplexity é amplamente reportada como ainda a cair em Referral, e o Claude, nomeado no lançamento mas ausente da lista publicada atual, está na mesma zona cinzenta. A Google também encaminha os seus próprios cliques de AI Overviews e AI Mode para Organic Search, não para AI Assistant. A única forma de teres a certeza quanto a uma fonte que te importa é verificar os teus próprios relatórios do GA4: filtra por essa fonte e vê o canal atribuído.
Não é retroativo. O canal só classifica o tráfego para a frente, a partir de 13 de maio de 2026. Cada visita de IA anterior a essa data fica enterrada em Referral ou Direct segundo os teus agrupamentos antigos, por isso a tendência histórica nunca é reconstruída.
Herda o problema do referrer. Como qualquer regra do lado do cliente, só apanha sessões que chegaram com um referrer intacto, por isso a maioria sem referrer cai na mesma em Direct.

Em vez de adivinhar o que faz a lista privada e mutável da Google, constrói um grupo de canais personalizado como rede de segurança que apanhe pelo nome cada assistente que te interessa:

Abre Administrar → Apresentação de dados → Grupos de canais e cria um novo grupo.
Adiciona um canal (por exemplo «Tráfego IA») com uma condição em que a Fonte corresponde a uma regex dos domínios acima:
chatgpt\.com|chat\.openai\.com|openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|bard\.google\.com|copilot\.microsoft\.com|bing\.com/chat|chat\.mistral\.ai|deepseek\.com|grok\.com|meta\.ai|you\.com
Arrasta o canal de IA acima de Referral na lista e depois guarda.
Revê a regex todos os trimestres à medida que surgem novos assistentes.

Como funciona a regex. O | significa «ou», por isso a regra diz ao GA4: se a fonte for chatgpt.com ou perplexity.ai ou chat.mistral.ai, e assim por diante, arquiva a visita em Tráfego IA. O \. faz o escape de cada ponto para que seja lido como um ponto literal, não como um caractere universal da regex.

Regras de canais do GA4 verificadas de cima para baixo: uma visita de chatgpt.com corresponde à regra 3, Tráfego IA (destacada), por isso a regra vence. A regra 4, Referral, está abaixo e nunca é alcançada. Uma nota diz: põe Tráfego IA acima de Referral, vence a primeira correspondência, por isso Referral nunca vê a visita — O GA4 lê as regras de canais de cima para baixo e para na primeira correspondência. Uma visita de chatgpt.com é tecnicamente uma referência, por isso se Referral estiver acima da tua regra de IA, apanha a visita primeiro. Pôr Tráfego IA acima de Referral deixa a tua regra vencer antes de o balde genérico a engolir.

O limite que não contornas com regex. Só apanha sessões que chegam com um referrer. Cerca de 70% das visitas de IA chega sem ele e cai em Direct, por isso até um grupo de canais perfeito vê apenas o terço visível do canal. A regex capta o que está rotulado; não consegue recuperar o que o navegador nunca enviou.

Por isso vale a pena fazê-lo, mas trata-o como uma solução parcial: é uma regra manual que tens de manter, e no GA4 assenta sobre uma plataforma que já faz amostragem dos teus relatórios assim que os volumes crescem. Um canal que é 1% do tráfego é exatamente o tipo de segmento pequeno que a amostragem arredonda até desaparecer.

Estimar a parte que não vês

Como a maior parte do tráfego de IA cai em Direct, a pergunta passa a ser: como estimas a porção oculta sem adivinhar? Três sinais ajudam a triangulá-la:

Tráfego Direct para páginas profundas. Ninguém digita nem adiciona aos favoritos o URL de um artigo longo ou de uma página de produto de nicho. Um aumento de Direct que cai em páginas profundas e específicas (em vez da homepage) é muitas vezes tráfego de IA e de pesquisa não atribuído. Segmenta o Direct por página de destino e vigia as profundas.
Subida das pesquisas de marca. Quem te descobre numa resposta de IA pesquisa muitas vezes depois o nome da tua marca para verificar. Uma subida de consultas de marca que acompanha as menções de IA é um sinal indireto mas real.
Logs do servidor. Os acessos dos crawlers GPTBot, PerplexityBot e ClaudeBot dizem-te que páginas os modelos estão a ler. Isso não mede visitas, mas indica onde as citações são provavelmente geradas, o que podes cruzar com os picos de Direct nesses mesmos URLs.

Nenhum destes sinais é exato. Juntos, transformam «não fazemos ideia» numa estimativa defensável, que é o máximo que uma medição honesta deste canal pode oferecer hoje.

Porque o canal merece a atenção

Seria razoável ignorar um canal de 1% se essas visitas se comportassem como todas as outras. Não se comportam. Nos estudos de 2026, os visitantes de IA convertem consistentemente bem acima da pesquisa orgânica, com taxas de conversão reportadas no intervalo da pesquisa paga e um tempo no site notavelmente mais alto do que o orgânico típico. A intuição por trás é simples: quem chega de uma resposta de IA já tem a pergunta enquadrada e em parte respondida, por isso aterra mais abaixo no funil de decisão do que um pesquisador a frio.

Um gráfico de barras que compara a taxa de conversão por canal: a pesquisa orgânica é baixa, enquanto o tráfego de IA e a pesquisa paga são ambos muito mais altos e no mesmo intervalo, com a anotação «mesmo nível» — Os visitantes de IA convertem no mesmo intervalo da pesquisa paga e bem acima do orgânico, porque chegam com a pergunta já enquadrada.

É por isso que a fuga para Direct sai cara. Quando as visitas de IA de alta intenção são mal atribuídas a Direct, duas coisas correm mal ao mesmo tempo. Subvalorizas o trabalho que ganha as citações de IA (o teu conteúdo, o teu SEO, o teu modelo de atribuição), e sobrevalorizas o Direct, que se torna uma gaveta de tudo que esconde o teu novo canal com melhor conversão. O canal é pequeno o suficiente para o ignorar e valioso o suficiente para que ignorá-lo seja um erro.

Como a Sublim lida com o tráfego de IA

A Sublim capta o referrer completo em cada evento e classifica-o automaticamente num canal de aquisição, por isso as visitas de ChatGPT, Perplexity, Claude e do resto aparecem como fonte própria de imediato, sem regex personalizada para construir ou manter. Como a Sublim nunca faz amostragem, um canal de 1% é reportado em resolução total em vez de ser arredondado até ao ruído, o que importa precisamente porque o tráfego de IA é pequeno e crescente.

O que a Sublim não consegue fazer — e que nenhuma ferramenta do lado do cliente consegue — é inventar um referrer que o navegador nunca enviou. A porção sem referrer é um limite duro da web, não de um produto em particular. Onde a Sublim ajuda é no resto do problema: fazer emergir de forma limpa o tráfego de IA rastreável, deixar-te segmentar o comportamento desses visitantes para ver se convertem, e dar-te a vista Direct-por-página-de-destino de que precisas para estimar a parte oculta. Medes com precisão o que é mensurável, e raciocinas sobre o resto com sinais reais em vez de uma estimativa por amostragem.

Acompanhe o seu tráfego de IA com precisão

Sem amostragem nem configuração — o Sublim deteta-o de imediato.

Em resumo

O tráfego de IA é pequeno hoje, mal medido em todo o lado, e vale mais por visita do que quase qualquer outro canal. Três jogadas põem-te à frente: separa os crawlers dos visitantes reais para não festejares bots, rotula de forma limpa as fontes de IA rastreáveis em vez de as deixares apodrecer em Direct, e constrói uma estimativa defensável da parte sem referrer usando Direct em páginas profundas, pesquisas de marca e logs do servidor. Fá-lo, e verás o canal crescer enquanto os teus concorrentes ainda decidem se 1% merece uma reunião.

Como rastrear o tráfego de IA do ChatGPT, Perplexity e Gemini

Primeiro, separa os crawlers dos visitantes

Porque o tráfego de IA se esconde em Direct

As fontes de IA que vale a pena vigiar

Rastrear o tráfego de IA no GA4

Estimar a parte que não vês

Porque o canal merece a atenção

Como a Sublim lida com o tráfego de IA

Em resumo

Artigos relacionados

A amostragem de dados do Google Analytics explicada: porque os teus relatórios são estimativas

Melhor alternativa ao Google Analytics em 2026: 7 ferramentas comparadas

Pronto para experimentar o Sublim?