Esempio di test di permutazione

Una domanda che è sempre importante porre in statistica è: "Il risultato osservato è dovuto solo al caso o è statisticamente significativo?" Una classe di test di ipotesi, chiamati test di permutazione, ci consente di testare questa domanda. La panoramica e i passaggi di tale test sono:

  • Abbiamo diviso i nostri soggetti in un gruppo di controllo e un gruppo sperimentale. L'ipotesi nulla è che non vi siano differenze tra questi due gruppi.
  • Applica un trattamento al gruppo sperimentale.
  • Misura la risposta al trattamento
  • Considera ogni possibile configurazione del gruppo sperimentale e la risposta osservata.
  • Calcola un valore p basato sulla nostra risposta osservata relativa a tutti i potenziali gruppi sperimentali.

Questo è lo schema di una permutazione. Alla base di questo schema, passeremo il tempo a guardare in dettaglio un esempio elaborato di tale test di permutazione.

Esempio

Supponiamo di studiare topi. In particolare, siamo interessati a quanto velocemente i topi finiscono un labirinto che non hanno mai incontrato prima. Desideriamo fornire prove a favore di un trattamento sperimentale. L'obiettivo è dimostrare che i topi nel gruppo di trattamento risolveranno il labirinto più rapidamente rispetto ai topi non trattati. 

Iniziamo con i nostri soggetti: sei topi. Per comodità, i topi saranno indicati dalle lettere A, B, C, D, E, F. Tre di questi topi devono essere scelti casualmente per il trattamento sperimentale, e gli altri tre sono inseriti in un gruppo di controllo in cui i soggetti ricevono un placebo.

Sceglieremo a caso l'ordine in cui i topi vengono selezionati per eseguire il labirinto. Il tempo impiegato per terminare il labirinto per tutti i topi verrà notato e verrà calcolata la media di ciascun gruppo.

Supponiamo che la nostra selezione casuale abbia topi A, C ed E nel gruppo sperimentale, con gli altri topi nel gruppo di controllo placebo. Dopo che il trattamento è stato implementato, scegliamo casualmente l'ordine per i topi di correre attraverso il labirinto. 

I tempi di esecuzione per ciascuno dei topi sono:

  • Il mouse A esegue la gara in 10 secondi
  • Il mouse B esegue la gara in 12 secondi
  • Il mouse C esegue la gara in 9 secondi
  • Il mouse D esegue la gara in 11 secondi
  • Il mouse E esegue la gara in 11 secondi
  • Il mouse F esegue la gara in 13 secondi.

Il tempo medio per completare il labirinto per i topi nel gruppo sperimentale è di 10 secondi. Il tempo medio per completare il labirinto per quelli nel gruppo di controllo è di 12 secondi.

Potremmo fare un paio di domande. Il trattamento è davvero il motivo del tempo medio più veloce? O siamo stati solo fortunati nella nostra selezione di controllo e gruppo sperimentale? Il trattamento potrebbe non aver avuto alcun effetto e abbiamo scelto casualmente i topi più lenti a ricevere il placebo e i topi più veloci a ricevere il trattamento. Un test di permutazione aiuterà a rispondere a queste domande.

ipotesi

Le ipotesi per il nostro test di permutazione sono:

  • L'ipotesi nulla è l'affermazione di nessun effetto. Per questo test specifico, abbiamo H0: Non vi è alcuna differenza tra i gruppi di trattamento. Il tempo medio per eseguire il labirinto per tutti i topi senza trattamento è uguale al tempo medio per tutti i topi con il trattamento.
  • L'ipotesi alternativa è ciò che stiamo cercando di stabilire prove a favore. In questo caso, avremmo Hun': Il tempo medio per tutti i topi con il trattamento sarà più veloce del tempo medio per tutti i topi senza il trattamento.

permutazioni

Ci sono sei topi e ci sono tre posti nel gruppo sperimentale. Ciò significa che il numero di possibili gruppi sperimentali è dato dal numero di combinazioni C (6,3) = 6! / (3! 3!) = 20. I restanti individui farebbero parte del gruppo di controllo. Quindi ci sono 20 modi diversi per scegliere casualmente gli individui nei nostri due gruppi.

L'assegnazione di A, C ed E al gruppo sperimentale è stata fatta in modo casuale. Poiché ci sono 20 di tali configurazioni, quella specifica con A, C ed E nel gruppo sperimentale ha una probabilità di 1/20 = 5% di occorrenza.