Guía de Comprender los agentes de IA, los chatbots

Esta guía explica Comprender los agentes de IA, los chatbots de forma práctica, con un enfoque en decisiones de analítica respetuosas con la privacidad.

El tráfico de IA no es una sola cosa. Un clic de referencia de ChatGPT, una solicitud de rastreador de OpenAI, una cita de fuente de Perplexity, un agente de automatización del navegador y un raspador que nunca se identifica pueden afectar tu sitio, pero significan cosas diferentes para el análisis.

El error práctico es ponerlos a todos en un solo grupo llamado tráfico de IA. Eso oculta la pregunta que tu panel debería responder: ¿fue una visita humana, una solicitud de una máquina o una mención externa que nunca produjo una visita?

Las cuatro interacciones de IA que vale la pena separar

1. Referencias de IA de motores de respuesta

Los productos de respuesta de IA pueden enviar visitantes reales cuando los usuarios hacen clic en una cita o en un enlace de fuente. Estas sesiones pueden aparecer como tráfico de referencia de dominios como chatgpt.com, perplexity.ai, claude.ai o gemini.google.com, según el producto y el contexto del navegador. No asumas que esos referentes son estables o completos; algunas aplicaciones, navegadores y contextos de privacidad los eliminan o reescriben.

Mídelos como sesiones humanas a menos que los controles de bots indiquen lo contrario. Las preguntas útiles son familiares: qué páginas obtienen citas, qué referentes de IA generan conversiones y si esos visitantes se comportan de manera diferente a los visitantes de búsqueda o sociales.

2. Rastreadores de IA y robots de indexación

Las empresas de inteligencia artificial ejecutan rastreadores para descubrir o recuperar contenido web. OpenAI documenta identidades de rastreadores separados, incluidos GPTBot, OAI-SearchBot y ChatGPT-User, con diferentes propósitos y tokens de agente de usuario. Google documenta el robot de Google para búsqueda y tokens de rastreador comunes separados, como Google-Extended, para algunos casos de uso de Gemini y Vertex AI (rastreadores de Google).

Los éxitos del rastreador no son una demanda de la audiencia. Pueden inflar las visitas a la página, distorsionar los informes geográficos y desencadenar eventos similares a las conversiones si tu configuración de análisis registra cada solicitud. Manténgalos en los registros del servidor o en los informes de los bots, pero exclúyalos de las métricas normales de rendimiento de marketing.

3. Agentes dirigidos por el usuario

Los agentes de IA son más complicados porque pueden actuar en nombre de un humano. Un usuario puede pedirle a un asistente que compare proveedores, complete un formulario, programe una reunión o resuma páginas de precios. En los registros, ese tráfico puede parecerse más a un navegador que a un rastreador. Puede recuperar JavaScript, seguir enlaces e interactuar con formularios.

Trata el tráfico de agentes como una clase separada cuando pueda identificarlo. No es un spam de bot común ni una sesión humana normal. La intención comercial puede ser real, pero la experiencia de la página, el tiempo de permanencia y la secuencia de eventos pueden ser sintéticos.

4. Menciones de IA sin hacer clic

Es posible que el mayor efecto de la IA nunca aparezca en la analítica web. Si un motor de respuesta resume tu contenido y el usuario está satisfecho, no se produce ningún clic de referencia. Tu contenido influyó en la decisión, pero tu herramienta de analítica no ve nada.

Esto es similar a la búsqueda sin clic, pero es más difícil de medir porque las interfaces de respuesta varían y la visibilidad de la fuente es inconsistente. Puedes monitorearlo indirectamente a través de cambios de búsqueda de marca, clics de referencias desde dominios de IA, llamadas de ventas que mencionan herramientas de IA y verificaciones manuales al azar de la cobertura de respuestas para temas de alto valor.

Cómo configurar análisis sin informes contaminantes

Empieza con una taxonomía simple:

Señal	Ejemplo	¿Cuenta como tráfico de audiencia?	Dónde analizarlo
Sesión de referencia de IA	Un usuario hace clic en un enlace de origen ChatGPT	Sí	Informes de adquisición y conversión
Solicitud de rastreador de IA	GPTBot recupera un artículo	No	Registros de servidor, análisis de bots, registros de CDN
Acción del agente de IA	Asistente abre páginas para una tarea de usuario	A veces	Segmento separado o registro de experimentos
Mención de IA sin clic	Tu guía aparece en una respuesta	No existe visita	SEO/seguimiento de marca, controles cualitativos

Luego ajuste la instrumentación:

Excluir agentes de usuario de rastreadores conocidos del análisis de vistas de página.
Mantén los registros del servidor sin procesar el tiempo suficiente para auditar picos inusuales.
Segmenta las referencias de IA como su propio grupo de origen en lugar de mezclarlas en tráfico de referencia genérico.
Evita contar como sesiones los eventos de visualización de páginas del lado del servidor provenientes de captadores previos, expansores de enlaces y rastreadores.
Agrega protecciones de formulario para que los envíos automáticos no se conviertan en conversiones de clientes potenciales.

Si utilizas una CDN, la gestión de bots puede ayudar. El control de rastreo de IA de Cloudflare, por ejemplo, informa categorías de rastreadores como GPTBot, ClaudeBot y Bytespider y ayuda a los propietarios de sitios a comprender cómo interactúan los rastreadores de IA con una zona. Eso pertenece al lado de la analítica, no dentro de la misma métrica que las visitas a páginas humanas.

Robots.txt ayuda, pero no es análisis

Robots.txt expresa preferencias por bots que se portan bien. No autentica la identidad, no bloquea todo el tráfico ni demuestra que una solicitud es legal. El propio centro de ayuda de Perplexity dice PerplexityBot honra a los robots.txt, mientras que Cloudflare ha informado públicamente de casos en los que creía que parte del tráfico de IA estaba ofuscado. La lección no es que todos los proveedores de IA se comporten de la misma manera. La lección es que la analítica no debe depender únicamente del archivo robots.txt para la clasificación.

Flowsery

—

Analítica orientada a ingresos para tu sitio web

Prueba gratuita

Panel en tiempo real

Seguimiento de objetivos

Rastreo sin cookies

Utiliza múltiples señales: agente de usuario, DNS inverso o rangos de IP publicados cuando estén disponibles, tasa de solicitudes, patrones de ruta, ejecución de JavaScript, comportamiento de cookies y puntuaciones de bots de CDN. Ten cuidado con el bloqueo agresivo, porque los buscadores dirigidos por el usuario pueden ser parte del flujo de trabajo de un usuario real.

Qué significa el tráfico de IA para la estrategia de contenidos

El descubrimiento de IA cambia el valor del contenido. Las páginas que respondan claramente a preguntas específicas pueden citarse o resumirse incluso si no generan sesiones orgánicas clásicas. Eso hace que la calidad de las fuentes, los títulos estructurados, la autoridad y las definiciones concisas sean más importantes.

Para el análisis de privacidad estilo Flowsery, se aplica el mismo principio de privacidad: no responder a la incertidumbre de la IA recopilando más datos personales. Puedes medir el rendimiento de la era de la IA con señales agregadas:

Sesiones de referencia de IA por dominio de origen.
Páginas de destino que reciben referencias de IA.
Tasa de conversión de visitantes referidos por IA.
Volumen de rastreo de bots por identidad del rastreador.
Carga del servidor causada por solicitudes automatizadas.
Páginas de contenido mencionadas en llamadas de ventas, conversaciones de soporte o encuestas a clientes.

Una revisión semanal práctica

Revise el tráfico de IA por separado de SEO:

Enumere los dominios de referencia de IA y las páginas de destino a las que enviaron tráfico.
Verifique si alguna sesión de referencia de IA se convirtió o alcanzó páginas de alta intención.
Compare el tráfico del rastreador en los registros del servidor con las vistas de páginas humanas.
Investigue los picos que afectan rápidamente a muchos URLs o ignore las rutas de navegación normales.
Actualice robots.txt solo después de decidir qué rastreadores desea permitir para búsquedas, respuestas de IA, entrenamiento de modelos o navegación dirigida por el usuario.

El objetivo no es perfeccionar el análisis de IA. El objetivo es evitar mezclar tres realidades diferentes: humanos que visitan tu sitio, máquinas que leen tu sitio y herramientas de inteligencia artificial que hablan de tu sitio en otro lugar.

Lista de verificación de clasificación de tráfico de IA

Para cada pico o fuente nueva, clasifíquelo antes de informarlo:

Sesión de referente: mantener en los informes de adquisición si se comporta como una visita humana.
Rastreador conocido: excluir de las métricas de audiencia y revisar en registros o análisis de CDN.
Recuperador dirigido por el usuario: segmenta por separado cuando es identificable porque puede representar una intención humana sin un comportamiento de navegación normal.
Scraper o spam bot: filtra los informes de marketing y protege los formularios.
Mención sin clic: seguimiento a través de canales cualitativos como notas de ventas, encuestas y búsqueda de marcas.

Esta taxonomía mantiene los paneles honestos. La influencia de la IA puede ser real sin que cada solicitud de la máquina se convierta en "tráfico".

Una guía práctica de Comprender los agentes de IA, los chatbots

TL;DR — Respuesta rápida

Las cuatro interacciones de IA que vale la pena separar

1. Referencias de IA de motores de respuesta

2. Rastreadores de IA y robots de indexación

3. Agentes dirigidos por el usuario

4. Menciones de IA sin hacer clic

Cómo configurar análisis sin informes contaminantes

Robots.txt ayuda, pero no es análisis

Flowsery

Qué significa el tráfico de IA para la estrategia de contenidos

Una revisión semanal práctica

Lista de verificación de clasificación de tráfico de IA

¿Te resultó útil este artículo?

Antes de irte...

Flowsery

Analítica orientada a ingresos para tu sitio web

Artículos relacionados

Una guía práctica de Por qué la generación de código de

Una guía práctica de Seguimiento de eventos personalizado

Una guía práctica de alternativa de código abierto a Google Analytics

Flowsery

Contáctenos