Se passi molto tempo a occuparti delle statistiche, molto presto ti imbatti nella frase "distribuzione di probabilità". È qui che possiamo davvero vedere quanto si sovrappongono le aree di probabilità e statistica. Sebbene ciò possa sembrare qualcosa di tecnico, la distribuzione della probabilità di frase è in realtà solo un modo per parlare dell'organizzazione di un elenco di probabilità. Una distribuzione di probabilità è una funzione o una regola che assegna le probabilità a ciascun valore di una variabile casuale. In alcuni casi la distribuzione può essere elencata. In altri casi, viene presentato come un grafico.
Supponiamo di tirare due dadi e quindi di registrare la somma dei dadi. Sono possibili somme da 2 a 12. Ogni somma ha una probabilità particolare di verificarsi. Possiamo semplicemente elencarli come segue:
Questo elenco è una distribuzione di probabilità per l'esperimento di probabilità del lancio di due dadi. Possiamo anche considerare quanto sopra come una distribuzione di probabilità della variabile casuale definita osservando la somma dei due dadi.
È possibile rappresentare graficamente una distribuzione di probabilità, e talvolta questo ci aiuta a mostrarci caratteristiche della distribuzione che non erano evidenti dalla sola lettura dell'elenco delle probabilità. La variabile casuale viene tracciata lungo il X-asse e la probabilità corrispondente viene tracciata lungo il y-asse. Per una variabile casuale discreta, avremo un istogramma. Per una variabile casuale continua, avremo l'interno di una curva liscia.
Le regole della probabilità sono ancora in vigore e si manifestano in alcuni modi. Poiché le probabilità sono maggiori o uguali a zero, il grafico di una distribuzione di probabilità deve avere y-coordinate non negative. Un'altra caratteristica delle probabilità, vale a dire che uno è il massimo che può essere la probabilità di un evento, si presenta in un altro modo.
Il grafico di una distribuzione di probabilità è costruito in modo tale che le aree rappresentino le probabilità. Per una distribuzione di probabilità discreta, stiamo davvero solo calcolando le aree dei rettangoli. Nel grafico sopra, le aree delle tre barre corrispondenti a quattro, cinque e sei corrispondono alla probabilità che la somma dei nostri dadi sia quattro, cinque o sei. Le aree di tutte le barre si sommano a un totale di uno.
Nella distribuzione normale standard o nella curva a campana, abbiamo una situazione simile. L'area sotto la curva tra due z i valori corrispondono alla probabilità che la nostra variabile rientri tra questi due valori. Ad esempio, l'area sotto la curva della campana per -1 z.
Esistono letteralmente infinite distribuzioni di probabilità. Segue un elenco di alcune delle distribuzioni più importanti: