Il termine campana curva è usato per descrivere il concetto matematico chiamato distribuzione normale, a volte indicato come distribuzione gaussiana. "Curva a campana" si riferisce alla forma della campana che viene creata quando viene tracciata una linea utilizzando i punti dati per un elemento che soddisfa i criteri di distribuzione normale.
In una curva a campana, il centro contiene il maggior numero di un valore e, pertanto, è il punto più alto sull'arco della linea. Questo punto è riferito alla media, ma in termini semplici è il numero più alto di occorrenze di un elemento (in termini statistici, la modalità).
La cosa importante da notare su una distribuzione normale è che la curva è concentrata al centro e diminuisce su entrambi i lati. Ciò è significativo in quanto i dati hanno meno tendenza a produrre valori insolitamente estremi, chiamati outlier, rispetto ad altre distribuzioni. Inoltre, la curva a campana indica che i dati sono simmetrici. Ciò significa che è possibile creare ragionevoli aspettative in merito alla possibilità che un risultato risieda in un intervallo a sinistra o a destra del centro, una volta misurata la quantità di deviazione contenuta nei dati, misurata in termini di deviazioni standard.
Un grafico della curva a campana dipende da due fattori: la media e la deviazione standard. La media identifica la posizione del centro e la deviazione standard determina l'altezza e la larghezza della campana. Ad esempio, una grande deviazione standard crea una campana che è corta e larga mentre una piccola deviazione standard crea una curva alta e stretta.
Per comprendere i fattori di probabilità di una distribuzione normale, è necessario comprendere le seguenti regole:
Gli articoli 2, 3 e 4 sopra sono talvolta indicati come regola empirica o regola 68-95-99.7. Una volta determinato che i dati sono normalmente distribuiti (campana curva) e calcolato la media e la deviazione standard, è possibile determinare la probabilità che un singolo punto dati rientri in un determinato intervallo di possibilità.
Un buon esempio di curva a campana o distribuzione normale è il lancio di due dadi. La distribuzione è centrata attorno al numero sette e la probabilità diminuisce man mano che ci si allontana dal centro.
Ecco la probabilità percentuale dei vari risultati quando si tirano due dadi.
Le distribuzioni normali hanno molte proprietà convenienti, quindi in molti casi, specialmente in fisica e astronomia, si presume che le variazioni casuali con distribuzioni sconosciute siano normali per consentire calcoli di probabilità. Anche se questo può essere un presupposto pericoloso, spesso è una buona approssimazione a causa di un risultato sorprendente noto come teorema del limite centrale.
Questo teorema afferma che la media di qualsiasi insieme di varianti con qualsiasi distribuzione avente una media e una varianza finite tende a presentarsi in una distribuzione normale. Molti attributi comuni come i punteggi dei test o l'altezza seguono distribuzioni pressoché normali, con pochi membri alle estremità alte e basse e molti al centro.
Esistono alcuni tipi di dati che non seguono un normale modello di distribuzione. Questi set di dati non dovrebbero essere forzati a provare ad adattare una curva a campana. Un classico esempio potrebbe essere il voto degli studenti, che spesso ha due modalità. Altri tipi di dati che non seguono la curva includono reddito, crescita della popolazione e guasti meccanici.