Un'analisi fattoriale della varianza, nota anche come ANOVA, ci offre un modo per fare confronti multipli di diversi mezzi della popolazione. Piuttosto che farlo in modo accoppiato, possiamo esaminare simultaneamente tutti i mezzi considerati. Per eseguire un test ANOVA, dobbiamo confrontare due tipi di variazione, la variazione tra i mezzi di campionamento e la variazione all'interno di ciascuno dei nostri campioni.
Combiniamo tutte queste variazioni in un'unica statistica, chiamata F statistica perché utilizza la distribuzione F. Lo facciamo dividendo la variazione tra i campioni per la variazione all'interno di ciascun campione. Il modo per farlo è in genere gestito dal software, tuttavia, c'è un valore nel vedere uno di questi calcoli risolto.
Sarà facile perdersi in ciò che segue. Ecco l'elenco dei passaggi che seguiremo nell'esempio seguente:
Il software fa tutto questo abbastanza facilmente, ma è bene sapere cosa sta succedendo dietro le quinte. In quanto segue elaboriamo un esempio di ANOVA seguendo i passaggi sopra elencati.
Supponiamo di avere quattro popolazioni indipendenti che soddisfano le condizioni per ANOVA a fattore singolo. Vogliamo testare l'ipotesi nulla H0: μ1 = μ2 = μ3 = μ4. Ai fini di questo esempio, utilizzeremo un campione di dimensioni tre proveniente da ciascuna delle popolazioni studiate. I dati dei nostri campioni sono:
La media di tutti i dati è 9.
Ora calcoliamo la somma delle deviazioni al quadrato da ciascuna media campionaria. Questa è chiamata la somma dei quadrati di errore.
Aggiungiamo quindi tutta questa somma di deviazioni quadrate e otteniamo 6 + 18 + 18 + 6 = 48.
Ora calcoliamo la somma dei quadrati di trattamento. Qui osserviamo le deviazioni al quadrato di ogni media campionaria dalla media complessiva e moltiplichiamo questo numero per uno in meno del numero di popolazioni:
3 [(11-9)2 + (10-9)2 +(8-9)2 + (7-9)2] = 3 [4 + 1 + 1 + 4] = 30.
Prima di procedere al passaggio successivo, abbiamo bisogno dei gradi di libertà. Ci sono 12 valori di dati e quattro campioni. Quindi il numero di gradi di libertà di trattamento è 4 - 1 = 3. Il numero di gradi di libertà di errore è 12 - 4 = 8.
Dividiamo ora la nostra somma di quadrati per il numero appropriato di gradi di libertà al fine di ottenere i quadrati medi.
Il passaggio finale di questo è quello di dividere il quadrato medio per il trattamento dal quadrato medio per errore. Questa è la statistica F dai dati. Pertanto, per il nostro esempio F = 10/6 = 5/3 = 1.667.
Tabelle di valori o software possono essere utilizzate per determinare la probabilità che ottenga un valore della statistica F estremo come questo valore solo per caso.