Una guía práctica de Comprender los agentes de IA, los chatbots
TL;DR — Respuesta rápida
6 min de lecturaLos sistemas de inteligencia artificial interactúan con sitios web como chatbots, motores de respuesta de búsqueda, rastreadores, scrapers y agentes dirigidos por el usuario. Trata las referencias de IA, las visitas de bots y las menciones sin clic como señales separadas en lugar de un solo canal de tráfico.
Esta guía explica Comprender los agentes de IA, los chatbots de forma práctica, con un enfoque en decisiones de analítica respetuosas con la privacidad.
El tráfico de IA no es una sola cosa. Un clic de referencia de ChatGPT, una solicitud de rastreador de OpenAI, una cita de fuente de Perplexity, un agente de automatización del navegador y un raspador que nunca se identifica pueden afectar tu sitio, pero significan cosas diferentes para el análisis.
El error práctico es ponerlos a todos en un solo grupo llamado tráfico de IA. Eso oculta la pregunta que tu panel debería responder: ¿fue una visita humana, una solicitud de una máquina o una mención externa que nunca produjo una visita?
Las cuatro interacciones de IA que vale la pena separar
1. Referencias de IA de motores de respuesta
Los productos de respuesta de IA pueden enviar visitantes reales cuando los usuarios hacen clic en una cita o en un enlace de fuente. Estas sesiones pueden aparecer como tráfico de referencia de dominios como chatgpt.com, perplexity.ai, claude.ai o gemini.google.com, según el producto y el contexto del navegador. No asumas que esos referentes son estables o completos; algunas aplicaciones, navegadores y contextos de privacidad los eliminan o reescriben.
Mídelos como sesiones humanas a menos que los controles de bots indiquen lo contrario. Las preguntas útiles son familiares: qué páginas obtienen citas, qué referentes de IA generan conversiones y si esos visitantes se comportan de manera diferente a los visitantes de búsqueda o sociales.
2. Rastreadores de IA y robots de indexación
Las empresas de inteligencia artificial ejecutan rastreadores para descubrir o recuperar contenido web. OpenAI documenta identidades de rastreadores separados, incluidos GPTBot, OAI-SearchBot y ChatGPT-User, con diferentes propósitos y tokens de agente de usuario. Google documenta el robot de Google para búsqueda y tokens de rastreador comunes separados, como Google-Extended, para algunos casos de uso de Gemini y Vertex AI (rastreadores de Google).
Los éxitos del rastreador no son una demanda de la audiencia. Pueden inflar las visitas a la página, distorsionar los informes geográficos y desencadenar eventos similares a las conversiones si tu configuración de análisis registra cada solicitud. Manténgalos en los registros del servidor o en los informes de los bots, pero exclúyalos de las métricas normales de rendimiento de marketing.
3. Agentes dirigidos por el usuario
Los agentes de IA son más complicados porque pueden actuar en nombre de un humano. Un usuario puede pedirle a un asistente que compare proveedores, complete un formulario, programe una reunión o resuma páginas de precios. En los registros, ese tráfico puede parecerse más a un navegador que a un rastreador. Puede recuperar JavaScript, seguir enlaces e interactuar con formularios.
Trata el tráfico de agentes como una clase separada cuando pueda identificarlo. No es un spam de bot común ni una sesión humana normal. La intención comercial puede ser real, pero la experiencia de la página, el tiempo de permanencia y la secuencia de eventos pueden ser sintéticos.
4. Menciones de IA sin hacer clic
Es posible que el mayor efecto de la IA nunca aparezca en la analítica web. Si un motor de respuesta resume tu contenido y el usuario está satisfecho, no se produce ningún clic de referencia. Tu contenido influyó en la decisión, pero tu herramienta de analítica no ve nada.
Esto es similar a la búsqueda sin clic, pero es más difícil de medir porque las interfaces de respuesta varían y la visibilidad de la fuente es inconsistente. Puedes monitorearlo indirectamente a través de cambios de búsqueda de marca, clics de referencias desde dominios de IA, llamadas de ventas que mencionan herramientas de IA y verificaciones manuales al azar de la cobertura de respuestas para temas de alto valor.
Cómo configurar análisis sin informes contaminantes
Empieza con una taxonomía simple:
| Señal | Ejemplo | ¿Cuenta como tráfico de audiencia? | Dónde analizarlo |
|---|---|---|---|
| Sesión de referencia de IA | Un usuario hace clic en un enlace de origen ChatGPT | Sí | Informes de adquisición y conversión |
| Solicitud de rastreador de IA | GPTBot recupera un artículo | No | Registros de servidor, análisis de bots, registros de CDN |
| Acción del agente de IA | Asistente abre páginas para una tarea de usuario | A veces | Segmento separado o registro de experimentos |
| Mención de IA sin clic | Tu guía aparece en una respuesta | No existe visita | SEO/seguimiento de marca, controles cualitativos |
Luego ajuste la instrumentación:
- Excluir agentes de usuario de rastreadores conocidos del análisis de vistas de página.
- Mantén los registros del servidor sin procesar el tiempo suficiente para auditar picos inusuales.
- Segmenta las referencias de IA como su propio grupo de origen en lugar de mezclarlas en tráfico de referencia genérico.
- Evita contar como sesiones los eventos de visualización de páginas del lado del servidor provenientes de captadores previos, expansores de enlaces y rastreadores.
- Agrega protecciones de formulario para que los envíos automáticos no se conviertan en conversiones de clientes potenciales.
Si utilizas una CDN, la gestión de bots puede ayudar. El control de rastreo de IA de Cloudflare, por ejemplo, informa categorías de rastreadores como GPTBot, ClaudeBot y Bytespider y ayuda a los propietarios de sitios a comprender cómo interactúan los rastreadores de IA con una zona. Eso pertenece al lado de la analítica, no dentro de la misma métrica que las visitas a páginas humanas.
Robots.txt ayuda, pero no es análisis
Robots.txt expresa preferencias por bots que se portan bien. No autentica la identidad, no bloquea todo el tráfico ni demuestra que una solicitud es legal. El propio centro de ayuda de Perplexity dice PerplexityBot honra a los robots.txt, mientras que Cloudflare ha informado públicamente de casos en los que creía que parte del tráfico de IA estaba ofuscado. La lección no es que todos los proveedores de IA se comporten de la misma manera. La lección es que la analítica no debe depender únicamente del archivo robots.txt para la clasificación.
Flowsery
Prueba gratuita
Panel en tiempo real
Seguimiento de objetivos
Rastreo sin cookies
Utiliza múltiples señales: agente de usuario, DNS inverso o rangos de IP publicados cuando estén disponibles, tasa de solicitudes, patrones de ruta, ejecución de JavaScript, comportamiento de cookies y puntuaciones de bots de CDN. Ten cuidado con el bloqueo agresivo, porque los buscadores dirigidos por el usuario pueden ser parte del flujo de trabajo de un usuario real.
Qué significa el tráfico de IA para la estrategia de contenidos
El descubrimiento de IA cambia el valor del contenido. Las páginas que respondan claramente a preguntas específicas pueden citarse o resumirse incluso si no generan sesiones orgánicas clásicas. Eso hace que la calidad de las fuentes, los títulos estructurados, la autoridad y las definiciones concisas sean más importantes.
Para el análisis de privacidad estilo Flowsery, se aplica el mismo principio de privacidad: no responder a la incertidumbre de la IA recopilando más datos personales. Puedes medir el rendimiento de la era de la IA con señales agregadas:
- Sesiones de referencia de IA por dominio de origen.
- Páginas de destino que reciben referencias de IA.
- Tasa de conversión de visitantes referidos por IA.
- Volumen de rastreo de bots por identidad del rastreador.
- Carga del servidor causada por solicitudes automatizadas.
- Páginas de contenido mencionadas en llamadas de ventas, conversaciones de soporte o encuestas a clientes.
Una revisión semanal práctica
Revise el tráfico de IA por separado de SEO:
- Enumere los dominios de referencia de IA y las páginas de destino a las que enviaron tráfico.
- Verifique si alguna sesión de referencia de IA se convirtió o alcanzó páginas de alta intención.
- Compare el tráfico del rastreador en los registros del servidor con las vistas de páginas humanas.
- Investigue los picos que afectan rápidamente a muchos URLs o ignore las rutas de navegación normales.
- Actualice robots.txt solo después de decidir qué rastreadores desea permitir para búsquedas, respuestas de IA, entrenamiento de modelos o navegación dirigida por el usuario.
El objetivo no es perfeccionar el análisis de IA. El objetivo es evitar mezclar tres realidades diferentes: humanos que visitan tu sitio, máquinas que leen tu sitio y herramientas de inteligencia artificial que hablan de tu sitio en otro lugar.
Lista de verificación de clasificación de tráfico de IA
Para cada pico o fuente nueva, clasifíquelo antes de informarlo:
- Sesión de referente: mantener en los informes de adquisición si se comporta como una visita humana.
- Rastreador conocido: excluir de las métricas de audiencia y revisar en registros o análisis de CDN.
- Recuperador dirigido por el usuario: segmenta por separado cuando es identificable porque puede representar una intención humana sin un comportamiento de navegación normal.
- Scraper o spam bot: filtra los informes de marketing y protege los formularios.
- Mención sin clic: seguimiento a través de canales cualitativos como notas de ventas, encuestas y búsqueda de marcas.
Esta taxonomía mantiene los paneles honestos. La influencia de la IA puede ser real sin que cada solicitud de la máquina se convierta en "tráfico".
¿Te resultó útil este artículo?
¡Cuéntanos qué opinas!
Antes de irte...
Flowsery
Analítica orientada a ingresos para tu sitio web
Rastrea cada visitante, fuente y conversión en tiempo real. Simple, potente y totalmente conforme con el RGPD.
Panel en tiempo real
Seguimiento de objetivos
Rastreo sin cookies
Artículos relacionados
Una guía práctica de Por qué la generación de código de
Por qué la generación de código de IA está haciendo obsoletas las pruebas A/B sin código se reduce a la velocidad, la flexibilidad y el costo cada vez menor de escribir código experimental directamente.
Una guía práctica de Seguimiento de eventos personalizado
Seguimiento de eventos personalizado: análisis centrado en la privacidad frente a Google Analytics 4 compara cómo cada enfoque mide los clics, los formularios, las compras y otras acciones significativas.
Una guía práctica de alternativa de código abierto a Google Analytics
Aprende cómo alternativa de código abierto a Google Analytics afecta a la analítica respetuosa con la privacidad, la calidad de medición y las decisiones prácticas del sitio web.