PaneliaHerramientas

Tamaño de muestra para un test A/B

La mayoría de los tests A/B fracasan antes de empezar: demasiado poco tráfico por variante, y la diferencia observada queda dentro del ruido estadístico. Antes de lanzar, dimensiona el orden de magnitud: esta calculadora, preajustada con un margen fino de ±2 %, te da el número de usuarios necesarios para medir cada variante con precisión — cuenta ese volumen EN CADA rama del test.

Ten presente la diferencia de objetivo: una encuesta estima una proporción; un test A/B detecta una diferencia entre dos proporciones. El tamaño de abajo garantiza la precisión de medida de cada variante. Para dimensionar con rigor la detección de un uplift pequeño (p. ej. +1 punto de conversión), complétalo con un cálculo de potencia estadística que integre el efecto mínimo detectable y el riesgo β.

Nivel de confianza

El 95 % es el estándar en estudios de mercado. Valores z: 1,645 · 1,96 · 2,576 (tablas estadísticas NIST).

La diferencia aceptable entre tu muestra y la realidad. ±5 % es la opción más común.

Si no lo sabes, deja 50 %: es el peor caso, el que exige la muestra más grande.

El número total de personas de tu público objetivo. Por encima de ~100 000 el impacto es insignificante: déjalo vacío.

Encuestados necesarios

2401

Necesitas 2401 encuestados para un nivel de confianza del 95 % con un margen de error de ±2 %.

Exportar:

¿Cuántos encuestados según la precisión?

La precisión sale cara: pasar de ±5 % a ±2 % multiplica la muestra por 6.

10100100010.0001 %3 %5 %8 %10 %Margen de error

Tabla resumen

Tamaño de muestra para las combinaciones más comunes.

Tabla resumen
Confianza± 3 %± 5 %± 10 %
90 %75227168
95 %106838597
99 %1844664166

El tamaño, resuelto. Queda el trabajo de campo…

Un trabajo de campo clásico lleva 6 semanas y 10 000 €. Panelia simula más de 300 encuestados calibrados en 10 minutos.

Simular mi estudio

Preguntas frecuentes

¿El resultado vale para todo el test o por variante?
Por variante. Un test A/B con ±2 % y 95 % de confianza requiere ~2 401 usuarios en la rama A Y otros tantos en la rama B.
¿Por qué ±2 % en lugar de ±5 % para un test A/B?
Porque las diferencias reales de conversión suelen ser pequeñas (1 a 3 puntos). Con ±5 % de margen, un uplift de 2 puntos es indetectable: los intervalos de ambas variantes se solapan.
¿Cuándo puedo parar mi test?
Cuando cada variante haya alcanzado el tamaño calculado DE ANTEMANO — no cuando la diferencia se vuelva significativa. Parar un test en cuanto «se pone en verde» infla drásticamente los falsos positivos.
Mi tasa de conversión es del 3 %, no del 50 %. ¿Qué cambia?
Indica 3 % en «proporción esperada»: p·(1−p) disminuye y la muestra requerida baja. El ajuste al 50 % sigue siendo la opción prudente si desconoces tu tasa base.