Guia de testes A/B para sites

Este guia explica testes A/B para sites na prática, com foco em decisões de analytics que respeitam a privacidade.

O teste AB é útil porque transforma uma mudança no site em um experimento controlado, em vez de um debate sobre gosto. A disciplina é simples: decida qual resultado de negócios você deseja melhorar, exponha visitantes comparáveis a diferentes versões e avalie se a mudança produziu um aumento real. A parte difícil é evitar a falsa confiança.

Uma configuração de análise que prioriza a privacidade pode apoiar bons experimentos sem transformar cada visitante em um perfil de publicidade de longa duração. Normalmente você precisa de visualizações de página, referenciadores, parâmetros de campanha, atribuição de variantes e um evento de conversão. Você não precisa de rastreamento entre sites, atributos confidenciais ou um gráfico de identidade para a maioria dos experimentos de sites.

O que conta como uma boa experiência de site

Um teste A/B útil tem quatro partes: uma hipótese, uma métrica primária, um método de atribuição aleatória e uma regra de parada. Por exemplo: "Se movermos a prova de preços para mais perto do botão de inscrição, o início do teste na página de preços aumentará porque os visitantes verão a redução do risco antes de decidirem." Isso é melhor do que “testar uma nova página de preços” porque diz o que deve mudar e por quê.

Escolha uma métrica primária antes do lançamento. As métricas secundárias ainda são úteis, mas não devem se tornar uma lista de compras para um resultado positivo após o fato. Um teste de página de preços SaaS pode usar a taxa de inscrição de teste como métrica principal e monitorar erros de checkout, cliques de suporte, profundidade de rolagem e solicitações de reembolso como proteção.

Atribuição aleatória é importante. Se os visitantes que retornam sempre veem o controle e os novos visitantes veem a variante, o resultado irá misturar sua mudança de design com diferenças de público. Comece com a atribuição no lado do servidor para a sessão atual ou para usuários autenticados onde a conta interna ID permanece dentro de seus próprios sistemas. Se você armazenar a variante atribuída em um cookie primário, armazenamento local ou armazenamento semelhante no navegador, trate esse armazenamento como potencialmente sujeito ao consentimento de privacidade eletrônica, a menos que uma isenção local restrita se aplique.

O que testar primeiro

Comece com mudanças ligadas a um ponto de decisão. As cores dos botões raramente são a melhor primeira experiência. Os melhores candidatos incluem clareza da mensagem, estrutura de preços, comprimento do formulário, prova próxima de um CTA de alta intenção, enquadramento de teste versus demonstração, atrito de checkout e opções de pagamento.

Priorize testes com tráfego suficiente e controle de desvantagens suficiente. Um teste de checkout pode produzir um sinal rápido, mas um checkout quebrado também custa dinheiro. Use sinalizadores de recursos, faça controle de qualidade de ambas as variantes e monitore as taxas de erro desde os primeiros minutos do lançamento.

Tamanho e tempo da amostra

Não interrompa um teste na primeira vez que um painel ficar verde. Espiar repetidamente aumenta a chance de um falso positivo. Os pesquisadores da Microsoft Ronny Kohavi, Diane Tang e Ya Xu enfatizam em seu trabalho experimental controlado on-line que os programas experimentais precisam de métricas claras, randomização e disciplina estatística, não apenas divisão de tráfego (Experiências controladas on-line confiáveis).

Para equipes práticas, defina estas regras antes do lançamento:

Tempo de execução mínimo: pelo menos um ciclo de negócios completo, geralmente sete dias, para que o comportamento durante a semana/fim de semana seja representado.
Conversões mínimas: conversões suficientes em cada variante para tornar o resultado significativo. Um teste com 20 conversões totais geralmente é direcional, não decisivo.
Efeito mínimo detectável: a menor elevação na qual você realmente agiria. Se um aumento de 1% não mudar seu roteiro, não projete o teste em torno da detecção de 1%.
Guardrails: métricas que podem invalidar um vencedor, como carregamento de página mais lento, reembolsos mais altos, menor ativação ou mais tickets de suporte.

Para sites de baixo tráfego, o teste A/B pode ser a ferramenta errada. Se sua página de preços obtiver 300 visitas por mês e 9 inscrições, um teste estatisticamente limpo levará muito tempo. Use primeiro pesquisas qualitativas, funis em nível de sessão, pesquisas, notas de ligações de vendas e testes de usabilidade. Em seguida, execute experimentos maiores e mais ousados, onde o efeito esperado seja grande o suficiente para ser detectado.

Implementação que prioriza a privacidade

Uma implementação mínima precisa de três eventos: exposição do experimento, conclusão da meta e eventos de proteção. Mantenha as propriedades do evento enfadonhas: página, nome do experimento, variante, carimbo de data/hora, origem e classe do dispositivo geralmente são suficientes.

Evite coletar endereços de e-mail, nomes, endereços IP brutos ou URLs completo contendo dados pessoais. Se os parâmetros da campanha forem necessários, mantenha os UTMs, mas retire os identificadores desnecessários. Se um URL puder conter um token, um pedido ID ou um endereço de e-mail, limpe-o antes que ele chegue à análise.

As regras de consentimento dependem da implementação. De acordo com a lei EU, o armazenamento ou acesso a informações no dispositivo do usuário é geralmente regido pelas leis nacionais que implementam a Diretiva de Privacidade Eletrônica, enquanto o processamento subsequente de dados pessoais se enquadra na GDPR. As orientações do artigo 5.º, n.º 3, do CEPD e as orientações sobre armazenamento e acesso do ICO sublinham que estas regras abrangem mais do que cookies, incluindo armazenamento local, pixels, SDKs e outros acessos a equipamentos terminais (orientações do artigo 5.º, n.º 3 do CEPD, orientações sobre tecnologias de armazenamento e acesso do ICO). O relatório da força-tarefa de banners de cookies do EDPB observa a divisão entre regras de acesso a cookies e regras de processamento GDPR (Força-tarefa de banners de cookies EDPB).

Se a sua experiência utilizar cookies não essenciais, armazenamento local, rastreamento de terceiros ou destinos de publicidade, você poderá precisar de consentimento. Se você executar um experimento estritamente necessário no lado do servidor, sem perfil pessoal, a análise será diferente, mas documente seu raciocínio e evite que a tarefa se torne um identificador oculto.

Flowsery

—

Analytics orientado para receitas para o seu site

Teste gratuito

Painel em tempo real

Rastreamento de metas

Rastreamento sem cookies

Lendo o resultado

Uma variante vencedora deve responder a três perguntas: a métrica primária melhorou, as barreiras de proteção permaneceram saudáveis e o efeito é grande o suficiente para ser importante? Tenha cuidado com a análise de segmento. Se você dividir os resultados em dez segmentos após o teste, um deles pode parecer dramático por acaso. Use segmentos para gerar hipóteses de acompanhamento, não para resgatar um resultado fraco.

Decida também o que acontece após uma perda. Um teste que falhou é útil quando remove uma ideia ruim do roteiro ou revela que a hipótese estava errada. Anote o resultado, a interpretação e a próxima ação. Com o tempo, seu arquivo de experimentos se torna uma base de conhecimento do produto.

O teste AB não é mágico. É uma forma de tornar as decisões do site menos frágeis. As melhores equipes usam-no com moderação, medem apenas o que precisam e tratam as restrições de privacidade como um requisito de design e não como um obstáculo.

Lista de verificação de conformidade do experimento

Antes de enviar um teste, confirme o método de atribuição, o comportamento de armazenamento, o gatilho de consentimento, a carga útil do evento, o período de retenção e os destinos do fornecedor. Em um navegador limpo, teste o carregamento da primeira página antes da escolha, após a rejeição e após a aceitação. Um experimento compatível não é apenas estatisticamente sólido; também prova que o armazenamento opcional e as tags respeitam a escolha do usuário.

Vincule cada métrica a uma decisão. As visualizações de página devem orientar o conteúdo e o trabalho de navegação, os referenciadores devem orientar o investimento no canal, as tags de campanha devem orientar os gastos e os eventos de conversão devem ser reconciliados com os registros de back-end. Se uma métrica não puder alterar uma decisão, arquive-a no painel principal.

Um guia prático de testes A/B para sites

TL;DR — Resposta rápida

O que conta como uma boa experiência de site

O que testar primeiro

Tamanho e tempo da amostra

Implementação que prioriza a privacidade

Flowsery

Lendo o resultado

Lista de verificação de conformidade do experimento

Este artigo foi útil?

Antes de ir...

Flowsery

Analytics orientado para receitas para o seu site

Artigos relacionados

O que é uma boa taxa de rejeição? Benchmarks por setor e dicas para melhorar

Um guia prático de rastreamento da jornada do cliente

Um guia prático de relatorio de funil

Flowsery

Contacte-nos