Esistono molte misure di diffusione o dispersione nelle statistiche. Sebbene l'intervallo e la deviazione standard siano più comunemente utilizzati, esistono altri modi per quantificare la dispersione. Vedremo come calcolare la deviazione assoluta media per un set di dati.
Iniziamo con la definizione della deviazione assoluta media, che viene anche definita deviazione assoluta media. La formula visualizzata con questo articolo è la definizione formale della deviazione assoluta media. Potrebbe avere più senso considerare questa formula come un processo, o una serie di passaggi, che possiamo usare per ottenere la nostra statistica.
Esistono diverse varianti per il processo sopra descritto. Nota che non abbiamo specificato esattamente cosa m è. La ragione di ciò è che potremmo usare una varietà di statistiche per m. In genere questo è il centro del nostro set di dati e quindi è possibile utilizzare qualsiasi misura di tendenza centrale.
Le misure statistiche più comuni del centro di un set di dati sono la media, la mediana e la modalità. Quindi uno qualsiasi di questi potrebbe essere usato come m nel calcolo della deviazione assoluta media. Questo è il motivo per cui è comune fare riferimento alla deviazione assoluta media sulla media o alla deviazione assoluta media sulla mediana. Vedremo diversi esempi di questo.
Supponiamo di iniziare con il seguente set di dati:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
La media di questo set di dati è 5. La tabella seguente organizzerà il nostro lavoro nel calcolo della deviazione assoluta media sulla media.
Valore dei dati | Deviazione dalla media | Valore assoluto di deviazione |
1 | 1 - 5 = -4 | | -4 | = 4 |
2 | 2-5 = -3 | | -3 | = 3 |
2 | 2-5 = -3 | | -3 | = 3 |
3 | 3 - 5 = -2 | | -2 | = 2 |
5 | 5 - 5 = 0 | | 0 | = 0 |
7 | 7 - 5 = 2 | | 2 | = 2 |
7 | 7 - 5 = 2 | | 2 | = 2 |
7 | 7 - 5 = 2 | | 2 | = 2 |
7 | 7 - 5 = 2 | | 2 | = 2 |
9 | 9 - 5 = 4 | | 4 | = 4 |
Totale delle deviazioni assolute: | 24 |
Dividiamo ora questa somma per 10, poiché ci sono un totale di dieci valori di dati. La deviazione assoluta media rispetto alla media è 24/10 = 2.4.
Ora iniziamo con un set di dati diverso:
1, 1, 4, 5, 5, 5, 5, 7, 7, 10.
Proprio come il set di dati precedente, la media di questo set di dati è 5.
Valore dei dati | Deviazione dalla media | Valore assoluto di deviazione |
1 | 1 - 5 = -4 | | -4 | = 4 |
1 | 1 - 5 = -4 | | -4 | = 4 |
4 | 4 - 5 = -1 | | -1 | = 1 |
5 | 5 - 5 = 0 | | 0 | = 0 |
5 | 5 - 5 = 0 | | 0 | = 0 |
5 | 5 - 5 = 0 | | 0 | = 0 |
5 | 5 - 5 = 0 | | 0 | = 0 |
7 | 7 - 5 = 2 | | 2 | = 2 |
7 | 7 - 5 = 2 | | 2 | = 2 |
10 | 10 - 5 = 5 | | 5 | = 5 |
Totale delle deviazioni assolute: | 18 |
Quindi la deviazione assoluta media rispetto alla media è 18/10 = 1,8. Confrontiamo questo risultato con il primo esempio. Sebbene la media fosse identica per ciascuno di questi esempi, i dati nel primo esempio erano più diffusi. Vediamo da questi due esempi che la deviazione assoluta media dal primo esempio è maggiore della deviazione assoluta media dal secondo esempio. Maggiore è la deviazione assoluta media, maggiore è la dispersione dei nostri dati.
Inizia con lo stesso set di dati del primo esempio:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
La mediana del set di dati è 6. Nella tabella seguente, mostriamo i dettagli del calcolo della deviazione assoluta media sulla mediana.
Valore dei dati | Deviazione dalla mediana | Valore assoluto di deviazione |
1 | 1 - 6 = -5 | | -5 | = 5 |
2 | 2-6 = -4 | | -4 | = 4 |
2 | 2-6 = -4 | | -4 | = 4 |
3 | 3 - 6 = -3 | | -3 | = 3 |
5 | 5 - 6 = -1 | | -1 | = 1 |
7 | 7 - 6 = 1 | | 1 | = 1 |
7 | 7 - 6 = 1 | | 1 | = 1 |
7 | 7 - 6 = 1 | | 1 | = 1 |
7 | 7 - 6 = 1 | | 1 | = 1 |
9 | 9 - 6 = 3 | | 3 | = 3 |
Totale delle deviazioni assolute: | 24 |
Ancora una volta dividiamo il totale per 10 e otteniamo una deviazione media media della mediana come 24/10 = 2.4.
Inizia con lo stesso set di dati di prima:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Questa volta troviamo che la modalità di questo set di dati è 7. Nella tabella seguente, mostriamo i dettagli del calcolo della deviazione assoluta media della modalità.
Dati | Deviazione dalla modalità | Valore assoluto di deviazione |
1 | 1 - 7 = -6 | | -5 | = 6 |
2 | 2-7 = -5 | | -5 | = 5 |
2 | 2-7 = -5 | | -5 | = 5 |
3 | 3 - 7 = -4 | | -4 | = 4 |
5 | 5 - 7 = -2 | | -2 | = 2 |
7 | 7 - 7 = 0 | | 0 | = 0 |
7 | 7 - 7 = 0 | | 0 | = 0 |
7 | 7 - 7 = 0 | | 0 | = 0 |
7 | 7 - 7 = 0 | | 0 | = 0 |
9 | 9 - 7 = 2 | | 2 | = 2 |
Totale delle deviazioni assolute: | 22 |
Dividiamo la somma delle deviazioni assolute e vediamo che abbiamo una deviazione assoluta media circa la modalità di 22/10 = 2,2.
Vi sono alcune proprietà di base relative alle deviazioni assolute medie
La deviazione assoluta media ha alcune applicazioni. La prima applicazione è che questa statistica può essere utilizzata per insegnare alcune idee alla base della deviazione standard. La deviazione assoluta media rispetto alla media è molto più facile da calcolare rispetto alla deviazione standard. Non ci richiede di quadrare le deviazioni e non abbiamo bisogno di trovare una radice quadrata alla fine del nostro calcolo. Inoltre, la deviazione assoluta media è più intuitivamente connessa alla diffusione del set di dati rispetto a quale sia la deviazione standard. Questo è il motivo per cui la deviazione assoluta media viene talvolta insegnata prima, prima di introdurre la deviazione standard.
Alcuni sono arrivati al punto di sostenere che la deviazione standard dovrebbe essere sostituita dalla deviazione assoluta media. Sebbene la deviazione standard sia importante per applicazioni scientifiche e matematiche, non è così intuitiva come la deviazione assoluta media. Per le applicazioni quotidiane, la deviazione assoluta media è un modo più tangibile per misurare la diffusione dei dati.