Cómo rastrear el tráfico de IA (ChatGPT, Perplexity, Gemini) en 2026

Para la mayoría de los sitios, el tráfico de los asistentes de IA todavía ronda el 1 % de las visitas totales. Es fácil descartar esa cifra, y la mayoría de los equipos lo hace. También es la cifra equivocada en la que fijarse, por dos razones: crece rápido, y los visitantes que hay detrás convierten a tasas más cercanas a la búsqueda de pago que a la orgánica. El canal es pequeño, de alta intención y casi totalmente mal medido.

La mala medición es la verdadera historia. Varios estudios de 2026 sitúan en torno al 70 % la proporción de sesiones de referencia de IA que llegan sin cabecera de referente. Esas sesiones no aparecen como «ChatGPT» o «Perplexity» en tus informes. Caen en Direct, mezcladas con marcadores y URLs tecleadas, y el canal parece no ser nada. Si juzgas el tráfico de IA por lo que tu panel etiqueta como IA, solo ves una fracción.

Esta guía explica qué es realmente el tráfico de IA, por qué se esconde, cómo rastrear la parte rastreable y cómo razonar sobre la parte que no lo es.

Primero, separa los rastreadores de los visitantes

La expresión «tráfico de IA» se usa para dos cosas completamente distintas, y confundirlas es el error más común.

Los rastreadores de IA son bots que recuperan tus páginas para entrenar modelos o construir un índice de búsqueda: GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot, Google-Extended. Aparecen en los logs de tu servidor, no en tu analítica, y no son personas. Mucha actividad de rastreo significa que los modelos te están leyendo. No significa que nadie haya visitado.
El tráfico de referencia de IA es un humano que le hizo una pregunta a un asistente, vio tu sitio citado o enlazado en la respuesta e hizo clic. Es un visitante real con intención real, y es el tráfico que vale la pena medir.

Ser citado por un asistente (el lado del rastreador) y ser clicado desde esa cita (el lado del visitante) son resultados distintos. Un estudio encontró que solo el 12–18 % de las citas de Perplexity se convierten en un clic real. Que te mencionen no es lo mismo que te visiten, y tu analítica solo ve las visitas.

Dos columnas separadas por un signo de desigualdad. A la izquierda: los rastreadores de IA (GPTBot, PerplexityBot, ClaudeBot, Google-Extended) van a los logs del servidor, nunca a tu analítica, con la nota «te leen, nadie visitó». A la derecha: visitantes desde IA, humanos reales que preguntan a un asistente, ven una cita y hacen clic, van a tu analítica como una visita real. Una nota dice: ser citado no es ser visitado, solo el 12 a 18 por ciento de las citas se convierten en clic — Los rastreadores llegan a los logs de tu servidor y nunca aparecen en la analítica; solo los humanos que hacen clic en una cita se convierten en visitas medibles — y solo una fracción de las citas se convierte en clic.

Por qué el tráfico de IA se esconde en Direct

Cuando un navegador sigue un enlace, normalmente envía una cabecera de referente que le dice a tu sitio de dónde vino el clic. Esa cabecera es como cualquier herramienta de analítica etiqueta una visita como «google», «chatgpt.com», etc.

Los asistentes de IA rompen esto de varias formas:

Muchas respuestas se leen dentro de una app móvil o un cliente de escritorio, no en una pestaña del navegador. El paso de la app al navegador a menudo pierde el referente por completo.
Algunos asistentes lo eliminan a propósito. El AI Mode de Google, por ejemplo, usa un atributo noreferrer en sus enlaces, lo que hace ese tráfico irrastreable en cualquier herramienta de analítica del lado del cliente.
Los ajustes de privacidad y los wrappers de enlaces eliminan o reescriben los referentes por el camino.

El resultado: una gran parte de las visitas de IA reales llega sin fuente adjunta y se clasifica en Direct. No es un fallo de una sola herramienta. Afecta por igual a toda plataforma de analítica del lado del cliente, incluido GA4, incluidas las centradas en la privacidad. Ninguna herramienta puede etiquetar un referente que el navegador nunca envió.

Un flujo que muestra a un visitante haciendo clic en un enlace citado en una respuesta de IA, el referente perdido por el camino por tres causas (paso app-navegador, noreferrer, wrappers de enlaces y privacidad), y la visita cayendo en el cubo Direct de GA4, mezclada con marcadores y URLs tecleadas, donde queda oculta — El referente se elimina por el camino, así que una visita de IA de alta intención cae en Direct, indistinguible de un marcador. Alrededor del 70 % del tráfico de IA llega así.

Lo que esto significa en la práctica: tu cifra de «IA» reportada es un suelo, no la cifra real. La forma honesta de hablar del canal es «al menos esto», nunca «exactamente esto».

Las fuentes de IA que vale la pena vigilar

Para las sesiones que sí llevan referente, estos son los dominios que representan casi todo el tráfico de referencia de IA medible en 2026:

Asistente	Dominios de referente
ChatGPT	chatgpt.com, chat.openai.com, openai.com
Google Gemini	gemini.google.com, bard.google.com
Claude	claude.ai
Perplexity	perplexity.ai
Microsoft Copilot	copilot.microsoft.com, bing.com/chat
Otros	chat.mistral.ai, deepseek.com, grok.com, meta.ai, you.com

La distribución cambia constantemente. ChatGPT sigue liderando las referencias medibles, pero su cuota ha caído de más del 85 % hace un año a algo más del 60 % en 2026, mientras que Claude, Gemini y Perplexity han ganado terreno. Los motores regionales también cuentan: si una gran parte de tu audiencia está en Francia o Europa, el Vibe de Mistral (antes Le Chat; chat.mistral.ai) merece un sitio en tu lista junto a los actores globales. Sea cual sea la lista que construyas, planifica revisarla cada trimestre, porque la clasificación cambia de verdad así de rápido.

Rastrear el tráfico de IA en GA4

El 13 de mayo de 2026, GA4 añadió un canal nativo «AI Assistant» a su grupo de canales predeterminado, con disponibilidad amplia en todas las propiedades a principios de junio. Cuando un clic coincide con un asistente conocido, GA4 ahora lo etiqueta automáticamente (medio ai-assistant, canal AI Assistant) sin configuración. Es una mejora real, pero importan tres pegas antes de confiar en ella:

La lista reconocida solo se publica como ejemplos. Google nombra ChatGPT, Gemini, Deepseek, Copilot y Grok, pero llama a la lista no exhaustiva y mantiene privada la lista completa de referentes, así que la documentación por sí sola no puede decirte cómo se clasifica un asistente dado. En la práctica, se reporta ampliamente que Perplexity sigue cayendo en Referral, y Claude, nombrado en el lanzamiento pero ausente de la lista publicada actual, está en la misma zona gris. Google también enruta sus propios clics de AI Overviews y AI Mode a Organic Search, no a AI Assistant. La única forma de estar seguro con una fuente que te importa es revisar tus propios informes de GA4: filtra por esa fuente y mira su canal asignado.
No es retroactivo. El canal solo clasifica el tráfico hacia adelante desde el 13 de mayo de 2026. Cada visita de IA anterior a esa fecha queda enterrada en Referral o Direct según tus agrupaciones antiguas, así que la tendencia histórica nunca se reconstruye.
Hereda el problema del referente. Como cualquier regla del lado del cliente, solo captura sesiones que llegaron con un referente intacto, así que la mayoría sin referente cae igualmente en Direct.

En vez de adivinar lo que hace la lista privada y cambiante de Google, construye un grupo de canales personalizado como red de seguridad que capture por su nombre a cada asistente que te interese:

Abre Administrar → Visualización de datos → Grupos de canales y crea un grupo nuevo.
Añade un canal (por ejemplo «Tráfico IA») con una condición donde la Fuente coincida con una regex de los dominios de arriba:
chatgpt\.com|chat\.openai\.com|openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|bard\.google\.com|copilot\.microsoft\.com|bing\.com/chat|chat\.mistral\.ai|deepseek\.com|grok\.com|meta\.ai|you\.com
Arrastra el canal de IA por encima de Referral en la lista y guarda.
Revisa la regex cada trimestre a medida que aparecen nuevos asistentes.

Cómo funciona la regex. El | significa «o», así que la regla le dice a GA4: si la fuente es chatgpt.com o perplexity.ai o chat.mistral.ai, y así sucesivamente, archiva la visita bajo Tráfico IA. El \. escapa cada punto para que se lea como un punto literal, no como un comodín de regex.

Reglas de canales de GA4 comprobadas de arriba abajo: una visita de chatgpt.com coincide en la regla 3, Tráfico IA (resaltada), así que la regla gana. La regla 4, Referral, está debajo y nunca se alcanza. Una nota dice: pon Tráfico IA por encima de Referral, gana la primera coincidencia, así que Referral nunca ve la visita — GA4 lee las reglas de canales de arriba abajo y se detiene en la primera coincidencia. Una visita de chatgpt.com es técnicamente una referencia, así que si Referral está por encima de tu regla de IA, captura la visita primero. Poner Tráfico IA por encima de Referral deja que tu regla gane antes de que el cubo genérico se la trague.

El límite que no esquivas con regex. Solo captura sesiones que llegan con un referente. Alrededor del 70 % de las visitas de IA llega sin él y cae en Direct, así que incluso un grupo de canales perfecto solo ve el tercio visible del canal. La regex captura lo etiquetado; no puede recuperar lo que el navegador nunca envió.

Así que vale la pena hacerlo, pero trátalo como un arreglo parcial: es una regla manual que tienes que mantener, y en GA4 se asienta sobre una plataforma que ya muestrea tus informes en cuanto los volúmenes crecen. Un canal que es el 1 % del tráfico es justo el tipo de segmento pequeño que el muestreo redondea hasta hacerlo desaparecer.

Estimar la parte que no puedes ver

Como la mayor parte del tráfico de IA cae en Direct, la pregunta es: ¿cómo estimas la porción oculta sin adivinar? Tres señales ayudan a triangularla:

Tráfico Direct a páginas profundas. Nadie teclea ni marca la URL de un artículo largo o de una página de producto de nicho. Un aumento de Direct que cae en páginas profundas y específicas (en vez de la home) es muy a menudo tráfico de IA y de búsqueda sin atribuir. Segmenta Direct por página de destino y vigila las profundas.
Subida de búsquedas de marca. Quienes te descubren en una respuesta de IA a menudo buscan después el nombre de tu marca para verificar. Una subida de consultas de marca que acompaña a las menciones de IA es una señal indirecta pero real.
Logs del servidor. Las visitas de rastreadores de GPTBot, PerplexityBot y ClaudeBot te dicen qué páginas están leyendo los modelos. Eso no mide visitas, pero indica dónde se generan probablemente las citas, que puedes cruzar con los picos de Direct en esas mismas URLs.

Ninguna de estas señales es exacta. Juntas convierten «no tenemos ni idea» en una estimación defendible, que es lo máximo que una medición honesta de este canal puede ofrecer hoy.

Por qué el canal merece la atención

Sería razonable ignorar un canal del 1 % si esas visitas se comportaran como las demás. No lo hacen. En los estudios de 2026, los visitantes desde IA convierten de forma consistente muy por encima de la búsqueda orgánica, con tasas de conversión reportadas en el rango de la búsqueda de pago y un tiempo en página notablemente mayor que el orgánico típico. La intuición detrás es simple: quien llega desde una respuesta de IA ya tiene su pregunta enmarcada y en parte respondida, así que aterriza más abajo en el embudo de decisión que un buscador en frío.

Un gráfico de barras que compara la tasa de conversión por canal: la búsqueda orgánica es baja, mientras que el tráfico desde IA y la búsqueda de pago son mucho más altos y están en el mismo rango, con la anotación «mismo rango» — Los visitantes desde IA convierten en el mismo rango que la búsqueda de pago y muy por encima del orgánico, porque llegan con su pregunta ya enmarcada.

Por eso la fuga a Direct sale cara. Cuando las visitas de IA de alta intención se atribuyen mal a Direct, dos cosas salen mal a la vez. Infravaloras el trabajo que gana las citas de IA (tu contenido, tu SEO, tu modelo de atribución), y sobrevaloras Direct, que se convierte en un cajón de sastre que oculta tu nuevo canal con mejor conversión. El canal es lo bastante pequeño para ignorarlo y lo bastante valioso como para que ignorarlo sea un error.

Cómo Sublim maneja el tráfico de IA

Sublim captura el referente completo en cada evento y lo clasifica automáticamente en un canal de adquisición, así que las visitas de ChatGPT, Perplexity, Claude y el resto aparecen como su propia fuente de serie, sin regex personalizada que construir o mantener. Como Sublim nunca muestrea, un canal del 1 % se reporta a plena resolución en vez de redondearse hasta el ruido, lo que importa precisamente porque el tráfico de IA es pequeño y creciente.

Lo que Sublim no puede hacer — y lo que ninguna herramienta del lado del cliente puede hacer — es inventar un referente que el navegador nunca envió. La porción sin referente es un límite duro de la web, no de un producto concreto. Donde Sublim ayuda es en el resto del problema: sacar a la luz limpiamente el tráfico de IA rastreable, dejarte segmentar el comportamiento de esos visitantes para ver si convierten, y darte la vista de Direct-por-página-de-destino que necesitas para estimar la parte oculta. Mides con precisión lo que es medible, y razonas sobre el resto con señales reales en vez de con una estimación muestreada.

Mide tu tráfico de IA con precisión

Sin muestreo ni configuración: Sublim lo detecta desde el primer momento.

En resumen

El tráfico de IA es pequeño hoy, mal medido en todas partes y vale más por visita que casi cualquier otro canal. Tres movimientos te ponen por delante: separa los rastreadores de los visitantes reales para no celebrar bots, etiqueta limpiamente las fuentes de IA rastreables en vez de dejarlas pudrirse en Direct, y construye una estimación defendible de la parte sin referente usando Direct en páginas profundas, búsquedas de marca y logs del servidor. Haz eso y verás crecer el canal mientras tus competidores aún deciden si el 1 % merece una reunión.

Cómo rastrear el tráfico de IA de ChatGPT, Perplexity y Gemini

Primero, separa los rastreadores de los visitantes

Por qué el tráfico de IA se esconde en Direct

Las fuentes de IA que vale la pena vigilar

Rastrear el tráfico de IA en GA4

Estimar la parte que no puedes ver

Por qué el canal merece la atención

Cómo Sublim maneja el tráfico de IA

En resumen

Artículos similares

El muestreo de datos de Google Analytics explicado: por qué tus informes son estimaciones

Mejor alternativa a Google Analytics en 2026: 7 herramientas comparadas

¿Listo para probar Sublim?