La correlazione è un importante strumento statistico. Questo metodo nelle statistiche può aiutarci a determinare e descrivere la relazione tra due variabili. Dobbiamo stare attenti a usare e interpretare la correlazione correttamente. Uno di questi avvertimenti è di ricordare sempre che la correlazione non implica la causalità. Ci sono altri aspetti della correlazione con cui dobbiamo stare attenti. Quando si lavora con la correlazione dobbiamo anche essere cauti sulla correlazione ecologica.
La correlazione ecologica è una correlazione basata sulle medie. Sebbene ciò possa essere utile, e talvolta persino necessario da considerare, dobbiamo stare attenti a non dare per scontato che questo tipo di correlazione si applichi anche agli individui.
Illustreremo il concetto di correlazione ecologica e sottolineeremo che non può essere utilizzato in modo improprio, osservando alcuni esempi. Un esempio di correlazione ecologica tra due variabili è il numero di anni di istruzione e il reddito medio. Possiamo vedere che queste due variabili sono positivamente correlate abbastanza fortemente: maggiore è il numero di anni di istruzione, maggiore è il livello di reddito medio. Sarebbe un errore quindi pensare che questa correlazione valga per i singoli redditi.
Quando consideriamo le persone con gli stessi livelli di istruzione, i livelli di reddito sono ripartiti. Se costruissimo un diagramma a dispersione di questi dati, vedremmo questa diffusione di punti. Il risultato sarebbe che la correlazione tra istruzione e reddito individuale sarebbe molto più debole della correlazione tra anni di istruzione e reddito medio.
Un altro esempio di correlazione ecologica che prenderemo in considerazione riguarda i modelli di voto e il livello di reddito. A livello statale, gli stati più ricchi tendono a votare in proporzione più elevata per i candidati democratici. Gli stati più poveri votano in proporzioni più elevate per i candidati repubblicani. Per gli individui questa correlazione cambia. Una parte maggiore di individui più poveri vota i democratici e una parte più ampia di individui ricchi vota repubblicano.
Un terzo esempio di correlazione ecologica è quando osserviamo il numero di ore di esercizio settimanale e l'indice di massa corporea media. Qui il numero di ore di esercizio è la variabile esplicativa e l'indice di massa corporea media è la risposta. All'aumentare dell'esercizio, ci aspetteremmo che l'indice di massa corporea diminuisca. Osserveremmo così una forte correlazione negativa tra queste variabili. Tuttavia, se guardiamo al livello individuale la correlazione non sarebbe così forte.
La correlazione ecologica è correlata all'errore ecologico ed è un esempio di questo tipo di errore. Questo tipo di errore logico deduce che un'affermazione statistica relativa a un gruppo si applica anche agli individui all'interno di quel gruppo. Questa è una forma di fallacia della divisione, che confonde dichiarazioni che coinvolgono gruppi per individui.
Un altro modo in cui compaiono errori ecologici nelle statistiche è il paradosso di Simpson. Il paradosso di Simpson si riferisce al confronto tra due individui o popolazioni. Distingueremo tra questi due per A e B. Una serie di misurazioni potrebbe mostrare che una variabile ha sempre un valore più alto per A anziché B. Ma quando calcoliamo la media dei valori di questa variabile, vediamo che B è maggiore di A.
Il termine ecologico è legato all'ecologia. Un uso del termine ecologia è riferirsi a un certo ramo della biologia. Questa parte della biologia studia le interazioni tra gli organismi e il loro ambiente. Questa considerazione di un individuo come parte di qualcosa di molto più grande è il senso in cui viene chiamato questo tipo di correlazione.