Una guía práctica de retención de datos en Google Analytics
TL;DR — Respuesta rápida
5 min de lecturaLa configuración de retención de Google Analytics y el almacenamiento de datos basado en de EE. UU. crean riesgos de cumplimiento compuestos de GDPR que las organizaciones deben gestionar activamente o evitar por completo.
Esta guía explica retención de datos en Google Analytics de forma práctica, con un enfoque en decisiones de analítica respetuosas con la privacidad.
La retención de datos de Google Analytics es fácil de malinterpretar. En GA4, la configuración de retención afecta los datos a nivel de usuario y a nivel de evento utilizados en Exploraciones y en los informes de embudo, no en los informes agregados estándar. La documentación de Google enumera 2 meses y 14 meses para propiedades estándar, con opciones más largas para Google Analytics 360, y dice que los datos se eliminan automáticamente cuando llegan al final del período de retención (GA4 retención de datos).
Esa configuración no es sólo una conveniencia analítica. Es un control de privacidad.
Por qué es importante la retención según GDPR
El principio de limitación de almacenamiento del GDPR requiere que los datos personales se mantengan en forma identificable solo durante el tiempo necesario para el propósito. Si los datos de eventos sin procesar se conservan porque "podríamos necesitarlos algún día", el propósito es demasiado vago.
Los datos analíticos pueden incluir datos personales incluso cuando los nombres están ausentes. Los datos del dispositivo, los identificadores de cookies, los ID de usuario, las URL completas, la ubicación derivada de IP, los parámetros de eventos y las secuencias de comportamiento pueden identificar o seleccionar a una persona. Una retención más prolongada aumenta el impacto de las infracciones, el riesgo de acceso y la exposición regulatoria.
Qué resuelve y qué no resuelve la retención GA4
Los controles de retención GA4 pueden reducir el tiempo que los datos a nivel de evento permanecen disponibles para ciertas funciones de análisis. Pero no responden todas las preguntas sobre privacidad:
- Los informes agregados estándar no se ven afectados de la misma manera.
- La exportación de BigQuery crea un conjunto de datos independiente bajo tu control.
- Los productos vinculados pueden tener su propio comportamiento de retención.
- Los informes descargados y las copias del almacén necesitan su propia política.
- Las cuestiones de consentimiento y transferencia aún necesitan un análisis por separado.
Si exportas datos GA4 a BigQuery, Google dice que eres el propietario de los datos exportados y administras el acceso a través de los controles de BigQuery (GA4 BigQuery export). Eso significa que la responsabilidad de retención pasa a usted.
Patrones de retención riesgosos
Los problemas comunes incluyen:
- Dejar la retención predeterminada sin comprender las necesidades de presentación de informes.
- Exportación de datos sin procesar a un almacén sin programa de eliminación.
- Mantener los identificadores de usuario en análisis después de la eliminación de la cuenta.
- Almacenamiento de URL de página completa que incluyen correos electrónicos, tokens o términos de búsqueda.
- Brindar acceso amplio al personal a datos a nivel de eventos.
- Conservar datos con fines publicitarios después de que los usuarios opten por no participar.
Un mejor modelo de retención
Usar niveles:
Tiempo real y depuración: de horas a días. Útil para comprobaciones de implementación e investigación de incidentes.
Análisis de eventos sin procesar: 30 a 180 días, dependiendo de los ciclos del producto y la base legal.
Informes agregados: De 12 a 36 meses para análisis de tendencias, sin identificadores personales.
Registros financieros o contractuales: separados de la analítica web y conservados según obligaciones contables o legales.
Documente el propósito de cada nivel y automatice la eliminación. Las políticas de eliminación manual fallan silenciosamente.
Ventaja del análisis que prioriza la privacidad
Una plataforma de análisis que prioriza la privacidad y que evita cookies, identificaciones persistentes, huellas dactilares y almacenamiento IP sin procesar reduce el riesgo de retención desde el principio. Las métricas agregadas a menudo se pueden conservar por más tiempo porque es menos probable que identifiquen a individuos. Los acontecimientos crudos pueden ser de corta duración o evitarse por completo.
Flowsery
Prueba gratuita
Panel en tiempo real
Seguimiento de objetivos
Rastreo sin cookies
El objetivo no es eliminar el historial útil. Se trata de mantener la forma más útil del historial: tendencias, conversiones, campañas y rendimiento del contenido sin rastros personales innecesarios.
Lista de verificación
- Verifique la configuración de retención de GA4.
- Identificar todas las exportaciones y productos conexos.
- Defina la retención de eventos sin procesar, informes y tablas de almacén.
- Eliminar datos personales de los parámetros del evento.
- Restrinja el acceso a los datos a nivel de evento.
- Flujos de trabajo de eliminación de documentos para solicitudes de usuarios.
- Revisar la retención después de cambios importantes en el producto o legales.
La retención es donde las promesas de privacidad se vuelven realidad. Si no puede decir por qué todavía existe un conjunto de datos, probablemente sea el momento de agregarlo o eliminarlo.
Retención de propiedades del evento
La revisión de retención debe incluir propiedades de eventos, no solo marcas de tiempo de eventos. Una propiedad como search_term, account_id, page_location o checkout_step puede conllevar más riesgos de privacidad que el nombre del evento. Si necesita análisis de búsqueda, considere agrupar consultas, descartar consultas raras o revisar términos para contenido confidencial antes de almacenarlos.
Controles de acceso
La retención breve no ayuda si demasiadas personas pueden exportar datos mientras existen. Limite el acceso a análisis sin procesar a las personas que lo necesitan, prefiera paneles agregados para la mayoría de las partes interesadas y registre las exportaciones desde los almacenes de datos. Los datos analíticos a menudo parecen de bajo riesgo hasta que se combinan con CRM, facturación o datos de soporte. Las políticas de acceso deben asumir que las uniones pueden aumentar la sensibilidad.
Plantilla de política de retención
Redactar la póliza en lenguaje empresarial. Los eventos analíticos sin procesar se conservan durante un breve período de diagnóstico. Los informes agregados se conservan durante más tiempo para el análisis de tendencias. Las propiedades de eventos confidenciales se bloquean o redactan antes del almacenamiento. Las exportaciones requieren un propósito determinado y caducan. La configuración de retención de proveedores se revisa después del lanzamiento de productos, cambios de campaña y traspasos de agencia. La propia documentación GA4 de Google sobre retención de datos muestra que la configuración de retención afecta los datos a nivel de usuario y a nivel de evento de manera diferente, por lo que los equipos no deben asumir que un solo cambio resuelve todos los riesgos.
Para una configuración que priorice la privacidad, separe tres capas. Primero, eventos operativos en tiempo real utilizados para verificar el seguimiento. En segundo lugar, los eventos sin procesar recientes se utilizan para depurar formularios, campañas y embudos. En tercer lugar, agregar métricas históricas utilizadas para la estrategia. La mayoría de los equipos necesitan la tercera capa por mucho más tiempo que las dos primeras. Este diseño mantiene un historial útil y al mismo tiempo reduce la posibilidad de que identificadores, URL, términos de búsqueda o datos personales accidentales antiguos sigan disponibles años después de que expire el propósito original.
Acciones de auditoría de retención
Cree un inventario de retención para GA4 y cada destino conectado. Registre si están habilitadas la medición mejorada, Google Signals, la personalización de anuncios, el ID de usuario, la exportación de BigQuery, el modo de consentimiento, la medición entre dominios y la configuración específica de la región.
Luego separe lo que debe permanecer crudo de lo que puede convertirse en historia agregada. Mantenga los datos GA4 solo cuando el ecosistema de anuncios o informes de Google tenga un trabajo justificado; mueva las páginas de referencia, las referencias, las campañas, los objetivos y los embudos agregados a una configuración de menor riesgo siempre que sea posible.
¿Te resultó útil este artículo?
¡Cuéntanos qué opinas!
Antes de irte...
Flowsery
Analítica orientada a ingresos para tu sitio web
Rastrea cada visitante, fuente y conversión en tiempo real. Simple, potente y totalmente conforme con el RGPD.
Panel en tiempo real
Seguimiento de objetivos
Rastreo sin cookies
Artículos relacionados
Una guía práctica de analítica web conforme al RGPD
Aprende cómo analítica web conforme al RGPD afecta a la analítica respetuosa con la privacidad, la calidad de medición y las decisiones prácticas del sitio web.
Una guía práctica de Google Analytics y privacidad
Aprende cómo Google Analytics y privacidad afecta a la analítica respetuosa con la privacidad, la calidad de medición y las decisiones prácticas del sitio web.
Una guía práctica de ¿Cumplen Google Analytics y GA4 con el
¿Cumplen Google Analytics y GA4 con el RGPD? Análisis legal completo explica por qué el cumplimiento de GA4 depende del consentimiento, la configuración, las funciones publicitarias, los contratos, la base de transferencia y los datos que envías.