Il primo e il terzo quartile sono statistiche descrittive che sono misurazioni della posizione in un set di dati. Simile a come la mediana indica il punto intermedio di un set di dati, il primo quartile segna il quarto o il 25%. Circa il 25% dei valori dei dati è inferiore o uguale al primo quartile. Il terzo quartile è simile, ma per il 25% superiore dei valori dei dati. Esamineremo queste idee in modo più dettagliato in quanto segue.
Esistono diversi modi per misurare il centro di un insieme di dati. La media, la mediana, la modalità e la gamma media hanno tutti i loro vantaggi e limiti nell'esprimere la metà dei dati. Di tutti questi modi per trovare la media, la mediana è la più resistente agli outlier. Segna la metà dei dati, nel senso che metà dei dati è inferiore alla mediana.
Non c'è motivo per cui dobbiamo smettere di trovare solo la metà. E se decidessimo di continuare questo processo? Potremmo calcolare la mediana della metà inferiore dei nostri dati. La metà del 50% è il 25%. Pertanto, la metà o un quarto dei dati sarebbe inferiore a questo. Dato che abbiamo a che fare con un quarto del set originale, questa mediana della metà inferiore dei dati è chiamata primo quartile ed è indicata da Q1.
Non c'è motivo per cui abbiamo esaminato la metà inferiore dei dati. Invece, avremmo potuto guardare la metà superiore ed eseguire gli stessi passaggi di cui sopra. La mediana di questa metà, che indicheremo con Q3 divide anche il set di dati in quarti. Tuttavia, questo numero indica il primo quarto dei dati. Pertanto, tre quarti dei dati è inferiore al nostro numero Q3. Questo è il motivo per cui chiamiamo Q3 il terzo quartile.
Per chiarire tutto, diamo un'occhiata a un esempio. Potrebbe essere utile esaminare prima come calcolare la mediana di alcuni dati. Inizia con il seguente set di dati:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Ci sono un totale di venti punti dati nel set. Iniziamo trovando la mediana. Poiché esiste un numero pari di valori di dati, la mediana è la media del decimo e dell'undicesimo valore. In altre parole, la mediana è:
(7 + 8) / 2 = 7.5.
Ora guarda la metà inferiore dei dati. La mediana di questa metà si trova tra il quinto e il sesto valore di:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Pertanto, il primo quartile è uguale Q1 = (4 + 6) / 2 = 5
Per trovare il terzo quartile, guarda la metà superiore del set di dati originale. Dobbiamo trovare la mediana di:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Qui la mediana è (15 + 15) / 2 = 15. Quindi il terzo quartile Q3 = 15.
I quartili aiutano a darci un quadro più completo del nostro set di dati nel suo insieme. Il primo e il terzo quartile ci forniscono informazioni sulla struttura interna dei nostri dati. La metà centrale dei dati rientra tra il primo e il terzo quartile ed è centrata sulla mediana. La differenza tra il primo e il terzo quartile, chiamato intervallo interquartile, mostra come sono disposti i dati sulla mediana. Un piccolo intervallo interquartile indica i dati raggruppati attorno alla mediana. Un intervallo interquartile più ampio mostra che i dati sono più distribuiti.
È possibile ottenere un quadro più dettagliato dei dati conoscendo il valore più alto, chiamato valore massimo, e il valore più basso, chiamato valore minimo. Il minimo, primo quartile, mediana, terzo quartile e massimo sono un insieme di cinque valori chiamato riepilogo a cinque numeri. Un modo efficace per visualizzare questi cinque numeri è chiamato grafico a scatole o grafico a baffi.