Um guia prático de riscos de privacidade na retencao de dados
TL;DR — Resposta rápida
5 min de leituraAs configurações de retenção Google Analytics e o armazenamento de dados baseado nos EUA criam riscos compostos de conformidade GDPR que as organizações devem gerenciar ativamente ou evitar totalmente.
Este guia explica riscos de privacidade na retencao de dados na prática, com foco em decisões de analytics que respeitam a privacidade.
A retenção de dados Google Analytics é fácil de ser mal interpretada. Em GA4, as configurações de retenção afetam os dados de nível de usuário e de evento usados em Explorações e relatórios de funil, e não em relatórios agregados padrão. A documentação do Google lista 2 meses e 14 meses para propriedades padrão, com opções mais longas para Google Analytics 360, e diz que os dados são excluídos automaticamente quando atingem o final do período de retenção (retenção de dados GA4).
Essa configuração não é apenas uma conveniência analítica. É um controle de privacidade.
Por que a retenção é importante em GDPR
O princípio de limitação de armazenamento do GDPR exige que os dados pessoais sejam mantidos em forma identificável apenas enquanto for necessário para a finalidade. Se os dados brutos do evento forem mantidos porque “podemos precisar deles algum dia”, o propósito é muito vago.
Os dados analíticos podem incluir dados pessoais mesmo quando os nomes estão ausentes. Dados do dispositivo, identificadores de cookies, IDs de usuário, URLs completos, localização derivada de IP, parâmetros de eventos e sequências comportamentais podem identificar ou destacar uma pessoa. Uma retenção mais longa aumenta o impacto da violação, o risco de acesso e a exposição regulatória.
O que a retenção GA4 faz e não resolve
Os controles de retenção GA4 podem reduzir o tempo que os dados em nível de evento permanecem disponíveis para determinados recursos de análise. Mas eles não respondem a todas as questões de privacidade:
- Os relatórios agregados padrão não são afetados da mesma forma.
- A exportação do BigQuery cria um conjunto de dados separado sob seu controle.
- Os produtos vinculados podem ter seu próprio comportamento de retenção.
- Os relatórios baixados e as cópias do armazém precisam de sua própria política.
- As questões de consentimento e transferência ainda necessitam de análise separada.
Se você exportar dados GA4 para o BigQuery, o Google informará que você é o proprietário desses dados exportados e gerencia o acesso por meio de controles do BigQuery (GA4 exportação do BigQuery). Isso significa que a responsabilidade pela retenção passa para você.
Padrões de retenção arriscados
Problemas comuns incluem:
- Sair da retenção padrão sem entender as necessidades de relatórios.
- Exportação de dados brutos para um armazém sem programação de exclusão.
- Manter os identificadores dos usuários nas análises após a exclusão da conta.
- Armazenamento de URLs de página inteira que incluem e-mails, tokens ou termos de pesquisa.
- Dar acesso a dados em nível de evento para uma ampla equipe.
- Retenção de dados para fins publicitários após a desativação dos usuários.
Um melhor modelo de retenção
Use níveis:
Em tempo real e depuração: horas a dias. Útil para verificações de implantação e investigação de incidentes.
Análise de eventos brutos: 30 a 180 dias, dependendo dos ciclos do produto e da base legal.
Relatórios agregados: 12 a 36 meses para análise de tendências, sem identificadores pessoais.
Registros financeiros ou contratuais: separados da análise da web e retidos sob obrigações contábeis ou legais.
Documente a finalidade de cada camada e automatize a exclusão. As políticas de exclusão manual falham silenciosamente.
Vantagem de análise de privacidade em primeiro lugar
Uma plataforma de análise que prioriza a privacidade que evita cookies, IDs persistentes, impressões digitais e armazenamento IP bruto reduz o risco de retenção desde o início. As métricas agregadas muitas vezes podem ser mantidas por mais tempo porque têm menos probabilidade de identificar indivíduos. Os eventos brutos podem ter vida curta ou ser totalmente evitados.
Flowsery
Teste gratuito
Painel em tempo real
Rastreamento de metas
Rastreamento sem cookies
O objetivo não é excluir o histórico útil. É manter a forma mais útil de história: tendências, conversões, campanhas e desempenho de conteúdo sem rastros pessoais desnecessários.
Lista de verificação
- Verifique as configurações de retenção GA4.
- Identifique todas as exportações e produtos conectados.
- Defina a retenção para eventos brutos, relatórios e tabelas de warehouse.
- Remova os dados pessoais dos parâmetros do evento.
- Restrinja o acesso aos dados em nível de evento.
- Fluxos de trabalho de exclusão de documentos para solicitações de usuários.
- Revise a retenção após grandes alterações legais ou de produto.
É na retenção que as promessas de privacidade se tornam reais. Se você não consegue dizer por que um conjunto de dados ainda existe, provavelmente é hora de agregá-lo ou excluí-lo.
Retenção para propriedades de eventos
A revisão de retenção deve incluir propriedades do evento, não apenas carimbos de data/hora do evento. Uma propriedade como search_term, account_id, page_location ou checkout_step pode representar mais risco de privacidade do que o nome do evento. Se você precisar de análises de pesquisa, considere agrupar consultas, descartar consultas raras ou revisar termos de conteúdo confidencial antes de armazená-los.
Controles de acesso
A retenção curta não ajuda se muitas pessoas puderem exportar dados enquanto eles existirem. Limite o acesso à análise bruta às pessoas que precisam dela, prefira painéis agregados para a maioria das partes interessadas e registre exportações de data warehouses. Os dados analíticos geralmente parecem de baixo risco até que sejam combinados com CRM, faturamento ou dados de suporte. As políticas de acesso devem assumir que as junções podem aumentar a sensibilidade.
Modelo de política de retenção
Escreva a política em linguagem comercial. Os eventos analíticos brutos são mantidos por uma breve janela de diagnóstico. Os relatórios agregados são mantidos por mais tempo para análise de tendências. As propriedades de eventos confidenciais são bloqueadas ou editadas antes do armazenamento. As exportações exigem uma finalidade específica e expiram. As configurações de retenção de fornecedores são revisadas após lançamentos de produtos, alterações de campanha e transferências de agências. A própria documentação GA4 do Google sobre retenção de dados mostra que as configurações de retenção afetam os dados no nível do usuário e no nível do evento de maneira diferente, portanto, as equipes não devem presumir que uma alternância resolve todos os riscos.
Para uma configuração que prioriza a privacidade, separe três camadas. Primeiro, eventos operacionais em tempo real usados para verificar o rastreamento. Em segundo lugar, eventos brutos recentes usados para depurar formulários, campanhas e funis. Terceiro, agregue métricas históricas usadas para estratégia. A maioria das equipes precisa da terceira camada por muito mais tempo do que as duas primeiras. Esse design mantém um histórico útil e reduz a chance de identificadores antigos, URLs, termos de pesquisa ou dados pessoais acidentais permanecerem disponíveis anos após a expiração da finalidade original.
Ações de auditoria de retenção
Crie um inventário de retenção para GA4 e todos os destinos conectados. Registre se a medição aprimorada, Google Signals, personalização de anúncios, User-ID, exportação do BigQuery, modo de consentimento, medição de vários domínios e configurações específicas da região estão ativadas.
Em seguida, separe o que deve permanecer bruto do que pode se tornar história agregada. Mantenha os dados GA4 apenas onde o ecossistema de relatórios ou anúncios do Google tiver um trabalho justificado; mova páginas de linha de base, referenciadores, campanhas, metas e funis agregados para uma configuração de menor risco, sempre que possível.
Este artigo foi útil?
Diga-nos o que pensa!
Antes de ir...
Flowsery
Analytics orientado para receitas para o seu site
Rastreie cada visitante, fonte e conversão em tempo real. Simples, poderoso e totalmente conforme com o RGPD.
Painel em tempo real
Rastreamento de metas
Rastreamento sem cookies
Artigos relacionados
Um guia prático de analytics web em conformidade com o GDPR
Aprenda como analytics web em conformidade com o GDPR afeta analytics com foco em privacidade, qualidade de medição e decisões práticas para o site.
Um guia prático de Google Analytics e privacidade
Aprenda como Google Analytics e privacidade afeta analytics com foco em privacidade, qualidade de medição e decisões práticas para o site.
Um guia prático de Google Analytics e GA4 GDPR são compatíveis
Google Analytics e GA4 GDPR são compatíveis? A análise jurídica completa explica por que a conformidade com GA4 depende do consentimento, da configuração, dos recursos de publicidade, dos contratos, da base de transferência e dos dados que você envia.