Guía de pruebas A/B para sitios web

Esta guía explica pruebas A/B para sitios web de forma práctica, con un enfoque en decisiones de analítica respetuosas con la privacidad.

Las pruebas AB son útiles porque convierten el cambio de un sitio web en un experimento controlado en lugar de un debate sobre gustos. La disciplina es simple: decida qué resultado comercial desea mejorar, exponga a visitantes comparables a diferentes versiones y mida si el cambio produjo un impulso real. Lo difícil es evitar la falsa confianza.

Una configuración de análisis que priorice la privacidad puede respaldar buenos experimentos sin convertir a cada visitante en un perfil publicitario de larga duración. Por lo general, necesita visitas a la página, referencias, parámetros de campaña, asignación de variantes y un evento de conversión. No necesita seguimiento entre sitios, atributos confidenciales ni un gráfico de identidad para la mayoría de los experimentos de sitios web.

¿Qué se considera un buen experimento de sitio web?

Una prueba A/B útil consta de cuatro partes: una hipótesis, una métrica principal, un método de asignación aleatoria y una regla de detención. Por ejemplo: "Si acercamos la prueba de precios al botón de registro, el inicio de la prueba desde la página de precios aumentará porque los visitantes verán una reducción del riesgo antes de decidir". Eso es mejor que "probar una nueva página de precios" porque dice qué debería cambiar y por qué.

Elija una métrica principal antes del lanzamiento. Las métricas secundarias siguen siendo útiles, pero no deberían convertirse en una lista de compras para obtener un resultado positivo después del hecho. Una prueba de página de precios de SaaS podría utilizar la tasa de registro de prueba como métrica principal y monitorear los errores de pago, los clics de soporte, la profundidad de desplazamiento y las solicitudes de reembolso como barreras de seguridad.

La asignación aleatoria es importante. Si los visitantes que regresan siempre ven el control y los nuevos visitantes ven la variante, el resultado combinará su cambio de diseño con las diferencias de audiencia. Empieza con la asignación del lado del servidor para la sesión actual o para usuarios autenticados donde la identificación de la cuenta interna permanece dentro de tus propios sistemas. Si almacenas la variante asignada en una cookie de origen, almacenamiento local o almacenamiento similar del navegador, trata ese almacenamiento como potencialmente sujeto al consentimiento ePrivacy, a menos que se aplique una exención local limitada.

Qué probar primero

Empieza con cambios relacionados con un punto de decisión. Los colores de los botones rara vez son el mejor primer experimento. Los mejores candidatos incluyen claridad del mensaje, estructura de precios, longitud del formulario, prueba cerca de una CTA de alta intención, encuadre de prueba versus demostración, fricción en el proceso de pago y opciones de pago.

Priorice las pruebas con suficiente tráfico y suficiente control de desventajas. Una prueba de caja puede producir una señal rápida, pero una caja rota también cuesta dinero. Utiliza indicadores de funciones, controle la calidad de ambas variantes y supervise las tasas de error desde los primeros minutos del lanzamiento.

Tamaño de la muestra y momento

No detengas una prueba la primera vez que un tablero se ponga verde. Mirar repetidamente aumenta la posibilidad de un falso positivo. Los investigadores de Microsoft Ronny Kohavi, Diane Tang y Ya Xu enfatizan en su trabajo experimental controlado en línea que los programas experimentales necesitan métricas claras, aleatorización y disciplina estadística, no solo división del tráfico (Experimentos controlados en línea confiables).

Para equipos prácticos, establezca estas reglas antes del lanzamiento:

Tiempo de ejecución mínimo: al menos un ciclo comercial completo, generalmente siete días, por lo que se representa el comportamiento entre semana y fin de semana.
Conversiones mínimas: suficientes conversiones en cada variante para que el resultado sea significativo. Una prueba con 20 conversiones en total suele ser direccional, no decisiva.
Efecto mínimo detectable: el levantamiento más pequeño sobre el que realmente actuarías. Si un aumento del 1% no cambiaría su hoja de ruta, no diseñe la prueba en torno a la detección del 1%.
Barandillas: métricas que pueden invalidar a un ganador, como una carga de página más lenta, reembolsos más altos, activación más baja o más tickets de soporte.

Para sitios con poco tráfico, las pruebas A/B pueden ser la herramienta equivocada. Si su página de precios recibe 300 visitas por mes y 9 registros, una prueba estadísticamente limpia llevará mucho tiempo. Utiliza primero la investigación cualitativa, embudos a nivel de sesión, encuestas, notas de llamadas de ventas y pruebas de usabilidad. Luego, realiza experimentos más grandes y audaces donde el efecto esperado sea lo suficientemente grande como para detectarlo.

Implementación de privacidad primero

Una implementación mínima necesita tres eventos: exposición del experimento, consecución del objetivo y eventos de barrera. Mantén las propiedades del evento aburridas: la página, el nombre del experimento, la variante, la marca de tiempo, la fuente y la clase de dispositivo suelen ser suficientes.

Evita recopilar direcciones de correo electrónico, nombres, direcciones IP sin formato o URLs completos que contengan datos personales. Si los parámetros de la campaña son necesarios, mantenga los UTM pero elimine los identificadores innecesarios. Si una URL puede contener un token, un ID de pedido o una dirección de correo electrónico, límpielo antes de que llegue a análisis.

Las reglas de consentimiento dependen de la implementación. Según la legislación de la UE, el almacenamiento o el acceso a información en el dispositivo del usuario se rige generalmente por las leyes nacionales que implementan la Directiva ePrivacy, mientras que el tratamiento posterior de datos personales se rige por GDPR. Tanto las orientaciones del Artículo 5(3) del EDPB como las orientaciones sobre almacenamiento y acceso de la ICO enfatizan que estas reglas cubren más que cookies, incluido el almacenamiento local, los píxeles, los SDK y otros accesos a equipos terminales (orientaciones del Artículo 5(3) del EDPB, orientaciones sobre tecnologías de acceso y almacenamiento de la ICO). El informe del grupo de trabajo sobre banners de cookies del EDPB señala la división entre las reglas de acceso a las cookies y las reglas de tratamiento GDPR (Grupo de trabajo sobre banners de cookies del EDPB).

Si su experimento utiliza cookies no esenciales, almacenamiento local, seguimiento de terceros o destinos publicitarios, es posible que necesite consentimiento. Si ejecuta un experimento estrictamente necesario en el lado del servidor sin perfiles personales, el análisis es diferente, pero documente su razonamiento y evite que la tarea se convierta en un identificador oculto.

Flowsery

—

Analítica orientada a ingresos para tu sitio web

Prueba gratuita

Panel en tiempo real

Seguimiento de objetivos

Rastreo sin cookies

Leyendo el resultado

Una variante ganadora debería responder tres preguntas: ¿mejoró la métrica principal, las barreras de seguridad se mantuvieron saludables y el efecto es lo suficientemente grande como para importar? Ten cuidado con el análisis de segmentos. Si divide los resultados en diez segmentos después de la prueba, uno puede parecer dramático por casualidad. Utiliza segmentos para generar hipótesis de seguimiento, no para rescatar un resultado débil.

Decide también qué sucede después de una pérdida. Una prueba fallida es útil cuando elimina una mala idea de la hoja de ruta o revela que la hipótesis era incorrecta. Anota el resultado, la interpretación y la siguiente acción. Con el tiempo, su archivo de experimentos se convierte en una base de conocimiento del producto.

Las pruebas AB no son mágicas. Es una forma de hacer que las decisiones sobre sitios web sean menos frágiles. Los mejores equipos lo utilizan con moderación, miden solo lo que necesitan y tratan las limitaciones de privacidad como un requisito de diseño en lugar de un obstáculo.

Lista de verificación de cumplimiento del experimento

Antes de enviar una prueba, confirme el método de asignación, el comportamiento de almacenamiento, el activador del consentimiento, la carga útil del evento, el período de retención y los destinos del proveedor. En un navegador limpio, pruebe la carga de la primera página antes de la elección, después del rechazo y después de la aceptación. Un experimento compatible no solo es estadísticamente sólido; También demuestra que el almacenamiento y las etiquetas opcionales respetan la elección del usuario.

Vincula cada métrica a una decisión. Las visitas a las páginas deben guiar el contenido y el trabajo de navegación, las referencias deben guiar la inversión en el canal, las etiquetas de campaña deben guiar el gasto y los eventos de conversión deben conciliarse con los registros de backend. Si una métrica no puede cambiar una decisión, archívela desde el panel principal.

Una guía práctica de pruebas A/B para sitios web

TL;DR — Respuesta rápida

¿Qué se considera un buen experimento de sitio web?

Qué probar primero

Tamaño de la muestra y momento

Implementación de privacidad primero

Flowsery

Leyendo el resultado

Lista de verificación de cumplimiento del experimento

¿Te resultó útil este artículo?

Antes de irte...

Flowsery

Analítica orientada a ingresos para tu sitio web

Artículos relacionados

Una guía práctica de qué es una buena tasa de rebote

Una guía práctica de seguimiento del recorrido del cliente

Una guía práctica de informe de embudo

Flowsery

Contáctenos