PaneliaStrumenti

Dimensione del campione per un test A/B

La maggior parte dei test A/B fallisce prima di iniziare: troppo poco traffico per variante, e la differenza osservata resta nel rumore statistico. Prima di lanciare, stima l'ordine di grandezza: questo calcolatore, preimpostato su un margine fine di ±2 %, ti dà il numero di utenti necessari per misurare ogni variante con precisione — conta quel volume IN OGNI ramo del test.

Tieni presente la differenza di obiettivo: un sondaggio stima una proporzione; un test A/B rileva uno scarto tra due proporzioni. La dimensione qui sotto garantisce la precisione di misura di ogni variante. Per dimensionare con rigore la rilevazione di un piccolo uplift (es. +1 punto di conversione), integra con un calcolo di potenza statistica che includa l'effetto minimo rilevabile e il rischio β.

Livello di confidenza

Il 95 % è lo standard delle ricerche di mercato. Valori z: 1,645 · 1,96 · 2,576 (tavole statistiche NIST).

Lo scarto accettabile tra il tuo campione e la realtà. ±5 % è la scelta più comune.

Se non lo sai, lascia 50 %: è il caso peggiore, quello che richiede il campione più grande.

Il numero totale di persone del tuo target. Oltre ~100 000 l'impatto è trascurabile: lascia vuoto.

Rispondenti necessari

2401

Ti servono 2401 rispondenti per un livello di confidenza del 95% con un margine di errore di ±2%.

Esporta:

Quanti rispondenti per ogni livello di precisione?

La precisione costa cara: passare da ±5 % a ±2 % moltiplica il campione per 6.

10100100010.0001%3%5%8%10%Margine di errore

Tabella riepilogativa

Dimensione del campione per le combinazioni più comuni.

Tabella riepilogativa
Confidenza± 3%± 5%± 10%
90%75227168
95%106838597
99%1844664166

La dimensione è risolta. Resta il fieldwork…

Un fieldwork classico richiede 6 settimane e 10 000 €. Panelia simula oltre 300 rispondenti calibrati in 10 minuti.

Simula il mio studio

Domande frequenti

Il risultato vale per l'intero test o per variante?
Per variante. Un test A/B a ±2 % e 95 % di confidenza richiede ~2 401 utenti nel ramo A E altrettanti nel ramo B.
Perché ±2 % invece di ±5 % per un test A/B?
Perché gli scarti reali di conversione sono spesso piccoli (1–3 punti). Con ±5 % di margine, un uplift di 2 punti è non rilevabile: gli intervalli delle due varianti si sovrappongono.
Quando posso fermare il mio test?
Quando ogni variante ha raggiunto la dimensione calcolata IN ANTICIPO — non quando la differenza diventa significativa. Fermare un test appena «diventa verde» gonfia drasticamente i falsi positivi.
Il mio tasso di conversione è il 3 %, non il 50 %. Cosa cambia?
Inserisci 3 % in «proporzione attesa»: p·(1−p) diminuisce e il campione richiesto scende. L'impostazione al 50 % resta la scelta prudente se non conosci il tuo tasso di base.