Esempio di calcolo ANOVA

Un'analisi fattoriale della varianza, nota anche come ANOVA, ci offre un modo per fare confronti multipli di diversi mezzi della popolazione. Piuttosto che farlo in modo accoppiato, possiamo esaminare simultaneamente tutti i mezzi considerati. Per eseguire un test ANOVA, dobbiamo confrontare due tipi di variazione, la variazione tra i mezzi di campionamento e la variazione all'interno di ciascuno dei nostri campioni.

Combiniamo tutte queste variazioni in un'unica statistica, chiamata F statistica perché utilizza la distribuzione F. Lo facciamo dividendo la variazione tra i campioni per la variazione all'interno di ciascun campione. Il modo per farlo è in genere gestito dal software, tuttavia, c'è un valore nel vedere uno di questi calcoli risolto.

Sarà facile perdersi in ciò che segue. Ecco l'elenco dei passaggi che seguiremo nell'esempio seguente:

  1. Calcola le medie del campione per ciascuno dei nostri campioni, nonché la media di tutti i dati del campione.
  2. Calcola la somma dei quadrati di errore. Qui all'interno di ciascun campione, quadriamo la deviazione di ciascun valore di dati dalla media del campione. La somma di tutte le deviazioni al quadrato è la somma dei quadrati di errore, abbreviato SSE.
  3. Calcola la somma dei quadrati di trattamento. Quadriamo la deviazione di ogni media campionaria dalla media complessiva. La somma di tutte queste deviazioni quadrate viene moltiplicata per uno in meno del numero di campioni che abbiamo. Questo numero è la somma dei quadrati di trattamento, abbreviato SST.
  4. Calcola i gradi di libertà. Il numero complessivo di gradi di libertà è uno in meno rispetto al numero totale di punti dati nel nostro campione, oppure n - 1. Il numero di gradi di libertà di trattamento è uno in meno del numero di campioni utilizzati, oppure m - 1. Il numero di gradi di libertà di errore è il numero totale di punti dati, meno il numero di campioni o n - m.
  5. Calcola il quadrato medio dell'errore. Questo è indicato MSE = SSE / (n - m).
  6. Calcola il quadrato medio del trattamento. Questo è indicato MST = SST /m - '1.
  7. Calcola il F statistica. Questo è il rapporto tra i due quadrati medi che abbiamo calcolato. Così F = MST / MSE.

Il software fa tutto questo abbastanza facilmente, ma è bene sapere cosa sta succedendo dietro le quinte. In quanto segue elaboriamo un esempio di ANOVA seguendo i passaggi sopra elencati.

Dati e mezzi di campionamento

Supponiamo di avere quattro popolazioni indipendenti che soddisfano le condizioni per ANOVA a fattore singolo. Vogliamo testare l'ipotesi nulla H0: μ1 = μ2 = μ3 = μ4. Ai fini di questo esempio, utilizzeremo un campione di dimensioni tre proveniente da ciascuna delle popolazioni studiate. I dati dei nostri campioni sono:

  • Campione dalla popolazione n. 1: 12, 9, 12. Questo ha una media campionaria di 11.
  • Campione dalla popolazione n. 2: 7, 10, 13. Questo ha una media campionaria di 10.
  • Campione dalla popolazione n. 3: 5, 8, 11. Questo ha una media campionaria di 8.
  • Campione dalla popolazione n. 4: 5, 8, 8. Questo ha una media campionaria di 7.

La media di tutti i dati è 9.

Somma dei quadrati di errore

Ora calcoliamo la somma delle deviazioni al quadrato da ciascuna media campionaria. Questa è chiamata la somma dei quadrati di errore.

  • Per il campione dalla popolazione n. 1: (12-11)2 + (9-11)2 +(12-11)2 = 6
  • Per il campione dalla popolazione n. 2: (7-10)2 + (10-10)2 +(13 - 10)2 = 18
  • Per il campione dalla popolazione n. 3: (5 - 8)2 + (8 - 8)2 +(11 - 8)2 = 18
  • Per il campione dalla popolazione n. 4: (5 - 7)2 + (8 - 7)2 +(8 - 7)2 = 6.

Aggiungiamo quindi tutta questa somma di deviazioni quadrate e otteniamo 6 + 18 + 18 + 6 = 48.

Somma dei quadrati di trattamento

Ora calcoliamo la somma dei quadrati di trattamento. Qui osserviamo le deviazioni al quadrato di ogni media campionaria dalla media complessiva e moltiplichiamo questo numero per uno in meno del numero di popolazioni:

3 [(11-9)2 + (10-9)2 +(8-9)2 + (7-9)2] = 3 [4 + 1 + 1 + 4] = 30.

Gradi di libertà

Prima di procedere al passaggio successivo, abbiamo bisogno dei gradi di libertà. Ci sono 12 valori di dati e quattro campioni. Quindi il numero di gradi di libertà di trattamento è 4 - 1 = 3. Il numero di gradi di libertà di errore è 12 - 4 = 8.

Quadrati medi

Dividiamo ora la nostra somma di quadrati per il numero appropriato di gradi di libertà al fine di ottenere i quadrati medi.

  • Il quadrato medio per il trattamento è 30/3 = 10.
  • Il quadrato medio per errore è 48/8 = 6.

La statistica F

Il passaggio finale di questo è quello di dividere il quadrato medio per il trattamento dal quadrato medio per errore. Questa è la statistica F dai dati. Pertanto, per il nostro esempio F = 10/6 = 5/3 = 1.667.

Tabelle di valori o software possono essere utilizzate per determinare la probabilità che ottenga un valore della statistica F estremo come questo valore solo per caso.