Le misure di tendenza centrale sono numeri che descrivono ciò che è medio o tipico all'interno di una distribuzione di dati. Esistono tre principali misure di tendenza centrale: media, mediana e modalità. Sebbene siano tutte misure di tendenza centrale, ognuna è calcolata in modo diverso e misura qualcosa di diverso dalle altre.
La media è la misura più comune di tendenza centrale utilizzata da ricercatori e persone in tutti i tipi di professioni. È la misura della tendenza centrale che viene anche definita media. Un ricercatore può usare il mezzo per descrivere la distribuzione dei dati delle variabili misurate come intervalli o rapporti. Queste sono variabili che includono categorie o intervalli numericamente corrispondenti (come razza, classe, genere o livello di istruzione), nonché variabili misurate numericamente da una scala che inizia con zero (come il reddito familiare o il numero di figli all'interno di una famiglia).
Una media è molto facile da calcolare. Uno deve semplicemente aggiungere tutti i valori dei dati o "punteggi" e quindi dividere questa somma per il numero totale di punteggi nella distribuzione dei dati. Ad esempio, se cinque famiglie hanno rispettivamente 0, 2, 2, 3 e 5 figli, il numero medio di figli è (0 + 2 + 2 + 3 + 5) / 5 = 12/5 = 2.4. Ciò significa che le cinque famiglie hanno una media di 2,4 bambini.
La mediana è il valore nel mezzo di una distribuzione di dati quando tali dati sono organizzati dal valore più basso a quello più alto. Questa misura della tendenza centrale può essere calcolata per le variabili misurate con scale ordinali, di intervallo o di rapporto.
Anche il calcolo della mediana è piuttosto semplice. Supponiamo di avere il seguente elenco di numeri: 5, 7, 10, 43, 2, 69, 31, 6, 22. Innanzitutto, dobbiamo disporre i numeri in ordine dal più basso al più alto. Il risultato è questo: 2, 5, 6, 7, 10, 22, 31, 43, 69. La mediana è 10 perché è il numero medio esatto. Vi sono quattro numeri inferiori a 10 e quattro numeri superiori a 10.
Se la tua distribuzione dei dati ha un numero pari di casi, il che significa che non esiste un centro esatto, devi semplicemente regolare leggermente l'intervallo di dati per calcolare la mediana. Ad esempio, se aggiungiamo il numero 87 alla fine del nostro elenco di numeri sopra, abbiamo 10 numeri totali nella nostra distribuzione, quindi non esiste un solo numero medio. In questo caso, si prende la media dei punteggi per i due numeri medi. Nel nostro nuovo elenco, i due numeri medi sono 10 e 22. Quindi, prendiamo la media di questi due numeri: (10 + 22) / 2 = 16. La nostra mediana ora è 16.
La modalità è la misura della tendenza centrale che identifica la categoria o il punteggio che si verifica più frequentemente nella distribuzione dei dati. In altre parole, è il punteggio più comune o il punteggio che appare il maggior numero di volte in una distribuzione. La modalità può essere calcolata per qualsiasi tipo di dati, compresi quelli misurati come variabili nominali o per nome.
Ad esempio, supponiamo di osservare animali domestici appartenenti a 100 famiglie e la distribuzione è simile alla seguente:
Animale Numero di famiglie che lo possiedono
La modalità qui è "cane" poiché più famiglie possiedono un cane di qualsiasi altro animale. Nota che la modalità è sempre espressa come categoria o punteggio, non come frequenza di quel punteggio. Ad esempio, nell'esempio sopra, la modalità è "cane", non 60, ovvero il numero di volte in cui appare il cane.
Alcune distribuzioni non hanno affatto una modalità. Questo accade quando ogni categoria ha la stessa frequenza. Altre distribuzioni potrebbero avere più di una modalità. Ad esempio, quando una distribuzione ha due punteggi o categorie con la stessa frequenza più alta, viene spesso definita "bimodale".