Un istogramma è un tipo di grafico che ha ampie applicazioni nelle statistiche. Gli istogrammi forniscono un'interpretazione visiva dei dati numerici indicando il numero di punti dati compresi in un intervallo di valori. Questi intervalli di valori sono chiamati classi o bin. La frequenza dei dati che rientrano in ogni classe è rappresentata dall'uso di una barra. Maggiore è la barra, maggiore è la frequenza dei valori dei dati in quel cestino.
A prima vista, gli istogrammi sembrano molto simili ai grafici a barre. Entrambi i grafici utilizzano barre verticali per rappresentare i dati. L'altezza di una barra corrisponde alla frequenza relativa della quantità di dati nella classe. Maggiore è la barra, maggiore è la frequenza dei dati. Più la barra è bassa, più la frequenza dei dati è bassa. Ma l'aspetto può essere ingannevole. È qui che le somiglianze finiscono tra i due tipi di grafici.
La ragione per cui questi tipi di grafici sono diversi ha a che fare con il livello di misurazione dei dati. Da un lato, i grafici a barre vengono utilizzati per i dati al livello nominale di misurazione. I grafici a barre misurano la frequenza dei dati categorici e le classi per un grafico a barre sono queste categorie. D'altro canto, gli istogrammi vengono utilizzati per i dati che sono almeno a livello ordinale di misurazione. Le classi per un istogramma sono intervalli di valori.
Un'altra differenza chiave tra istogrammi e istogrammi ha a che fare con l'ordinamento delle barre. In un grafico a barre, è prassi comune riordinare le barre in ordine decrescente di altezza. Tuttavia, le barre in un istogramma non possono essere riorganizzate. Devono essere visualizzati nell'ordine in cui si verificano le classi.
Il diagramma sopra ci mostra un istogramma. Supponiamo che vengano lanciate quattro monete e che i risultati vengano registrati. L'uso della tabella di distribuzione binomiale appropriata o dei calcoli semplici con la formula binomiale mostra la probabilità che nessuna testa sia mostrata è 1/16, la probabilità che una testa sta mostrando è 4/16. La probabilità di due teste è 6/16. La probabilità di tre teste è di 4/16. La probabilità di quattro teste è 1/16.
Costruiamo un totale di cinque classi, ciascuna della larghezza una. Queste classi corrispondono al numero di teste possibili: zero, uno, due, tre o quattro. Sopra ogni classe, disegniamo una barra verticale o un rettangolo. Le altezze di queste barre corrispondono alle probabilità menzionate per il nostro esperimento di probabilità di lanciare quattro monete e contare le teste.
L'esempio sopra non solo dimostra la costruzione di un istogramma, ma mostra anche che le distribuzioni di probabilità discrete possono essere rappresentate con un istogramma. In effetti, la distribuzione discreta della probabilità può essere rappresentata da un istogramma.
Per costruire un istogramma che rappresenta una distribuzione di probabilità, iniziamo selezionando le classi. Questi dovrebbero essere i risultati di un esperimento di probabilità. La larghezza di ciascuna di queste classi dovrebbe essere di un'unità. Le altezze delle barre dell'istogramma sono le probabilità per ciascuno dei risultati. Con un istogramma costruito in questo modo, anche le aree delle barre sono probabili.
Poiché questo tipo di istogramma ci dà delle probabilità, è soggetto a un paio di condizioni. Una clausola è che solo i numeri non negativi possono essere usati per la scala che ci fornisce l'altezza di una data barra dell'istogramma. Una seconda condizione è che, poiché la probabilità è uguale all'area, tutte le aree delle barre devono sommarsi a un totale di uno, equivalente al 100%.
Le barre in un istogramma non devono necessariamente essere probabilità. Gli istogrammi sono utili in aree diverse dalla probabilità. Ogni volta che desideriamo confrontare la frequenza di occorrenza di dati quantitativi, un istogramma può essere utilizzato per rappresentare il nostro set di dati.