In statistica e matematica, l'intervallo è la differenza tra i valori massimo e minimo di un set di dati e funge da una delle due caratteristiche importanti di un set di dati. La formula per un intervallo è il valore massimo meno il valore minimo nel set di dati, che fornisce agli statistici una migliore comprensione della variabilità del set di dati.
Due caratteristiche importanti di un set di dati includono il centro dei dati e la diffusione dei dati, e il centro può essere misurato in diversi modi: i più popolari sono Media, Mediana, Modalità e Midrange, ma in in modo simile, ci sono diversi modi per calcolare la diffusione del set di dati e la misura più semplice e grossolana della diffusione è chiamata intervallo.
Il calcolo dell'intervallo è molto semplice. Tutto quello che dobbiamo fare è trovare la differenza tra il valore di dati più grande nel nostro set e il valore di dati più piccolo. Detto in breve, abbiamo la seguente formula: Range = Valore massimo-Valore minimo. Ad esempio, il set di dati 4,6,10, 15, 18 ha un massimo di 18, un minimo di 4 e un intervallo di 18-4 = 14.
L'intervallo è una misurazione molto grossolana della diffusione dei dati perché è estremamente sensibile agli outlier e, di conseguenza, ci sono alcune limitazioni all'utilità di un intervallo reale di un set di dati per gli statistici perché un singolo valore di dati può influire notevolmente il valore dell'intervallo.
Ad esempio, considera l'insieme di dati 1, 2, 3, 4, 6, 7, 7, 8. Il valore massimo è 8, il minimo è 1 e l'intervallo è 7. Quindi considera lo stesso insieme di dati, solo con il valore 100 incluso. La gamma ora diventa 100-1 = 99 in cui l'aggiunta di un singolo punto dati aggiuntivo ha influenzato notevolmente il valore dell'intervallo. La deviazione standard è un'altra misura della diffusione che è meno suscettibile agli outlier, ma lo svantaggio è che il calcolo della deviazione standard è molto più complicato.
La gamma non ci dice nulla sulle funzionalità interne del nostro set di dati. Ad esempio, consideriamo il set di dati 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 dove l'intervallo per questo set di dati è 10-1 = 9. Se poi confrontiamo questo con il set di dati di 1, 1, 1, 2, 9, 9, 9, 10. Qui l'intervallo è, ancora una volta, nove, tuttavia, per questo secondo set e, diversamente dal primo set, i dati è raggruppato attorno al minimo e al massimo. Altre statistiche, come il primo e il terzo quartile, dovrebbero essere utilizzate per rilevare parte di questa struttura interna.
L'intervallo è un buon modo per ottenere una comprensione molto semplice di come siano realmente i numeri sparsi nel set di dati perché è facile da calcolare in quanto richiede solo un'operazione aritmetica di base, ma ci sono anche alcune altre applicazioni dell'intervallo di un set di dati nelle statistiche.
L'intervallo può essere utilizzato anche per stimare un'altra misura di diffusione, la deviazione standard. Invece di passare attraverso una formula abbastanza complicata per trovare la deviazione standard, possiamo invece usare quella che viene chiamata la regola dell'intervallo. L'intervallo è fondamentale in questo calcolo.
L'intervallo si verifica anche in un diagramma a scatole o trama di baffi e baffi. I valori massimo e minimo sono entrambi rappresentati alla fine dei baffi del grafico e la lunghezza totale dei baffi e della scatola è uguale all'intervallo.