Una normale distribuzione di dati è quella in cui la maggior parte dei punti di dati sono relativamente simili, il che significa che si verificano in un piccolo intervallo di valori con un numero inferiore di valori anomali nelle estremità superiore e inferiore dell'intervallo di dati.
Quando i dati sono normalmente distribuiti, la loro rappresentazione su un grafico produce un'immagine a forma di campana e simmetrica spesso chiamata curva a campana. In una tale distribuzione di dati, media, mediana e modalità hanno tutti lo stesso valore e coincidono con il picco della curva.
Tuttavia, nelle scienze sociali, una distribuzione normale è più un ideale teorico che una realtà comune. Il concetto e l'applicazione di esso come una lente attraverso cui esaminare i dati è attraverso uno strumento utile per identificare e visualizzare norme e tendenze all'interno di un set di dati.
Una delle caratteristiche più evidenti di una distribuzione normale è la sua forma e la perfetta simmetria. Se pieghi un'immagine di una distribuzione normale esattamente nel mezzo, otterrai due metà uguali, ognuna un'immagine speculare dell'altra. Ciò significa anche che la metà delle osservazioni nei dati cade su entrambi i lati del centro della distribuzione.
Il punto medio di una distribuzione normale è il punto che ha la frequenza massima, ovvero il numero o la categoria di risposta con il maggior numero di osservazioni per quella variabile. Il punto medio della distribuzione normale è anche il punto in cui cadono tre misure: media, mediana e modalità. In una distribuzione perfettamente normale, queste tre misure hanno tutti lo stesso numero.
In tutte le distribuzioni normali o quasi normali, c'è una proporzione costante dell'area sotto la curva compresa tra la media e qualsiasi distanza data dalla media quando misurata in unità di deviazione standard. Ad esempio, in tutte le curve normali, il 99,73 percento di tutti i casi rientra in tre deviazioni standard dalla media, il 95,45 percento di tutti i casi rientra in due deviazioni standard dalla media e il 68,27 percento di casi rientra in una deviazione standard dalla media.
Le distribuzioni normali sono spesso rappresentate in punteggi standard o punteggi Z, che sono numeri che indicano la distanza tra un punteggio effettivo e la media in termini di deviazioni standard. La distribuzione normale standard ha una media di 0,0 e una deviazione standard di 1,0.
Anche se una distribuzione normale è teorica, ci sono diverse variabili studiate dai ricercatori che assomigliano molto a una curva normale. Ad esempio, i punteggi dei test standardizzati come SAT, ACT e GRE in genere assomigliano a una distribuzione normale. Altezza, capacità atletiche e numerosi atteggiamenti sociali e politici di una data popolazione in genere assomigliano a una curva a campana.
L'ideale di una distribuzione normale è utile anche come punto di confronto quando i dati non sono normalmente distribuiti. Ad esempio, la maggior parte delle persone presume che la distribuzione del reddito familiare negli Stati Uniti sarebbe una distribuzione normale e assomiglierebbe alla curva a campana quando tracciata su un grafico. Ciò significherebbe che la maggior parte dei cittadini statunitensi guadagna nella fascia di reddito media, o in altre parole, che esiste una classe media sana. Nel frattempo, il numero di quelli nelle classi economiche inferiori sarebbe piccolo, così come i numeri nelle classi superiori. Tuttavia, la reale distribuzione del reddito familiare negli Stati Uniti non assomiglia affatto a una curva a campana. La maggior parte delle famiglie cade nella fascia bassa e medio-bassa, il che significa che ci sono più persone povere che lottano per sopravvivere di quante persone vivano una vita confortevole nella classe media. In questo caso, l'ideale di una distribuzione normale è utile per illustrare la disparità di reddito.