Quale livello di alfa determina il significato statistico?

Non tutti i risultati dei test di ipotesi sono uguali. Un test di ipotesi o un test di significatività statistica ha in genere un livello di significatività associato. Questo livello di significatività è un numero tipicamente indicato con la lettera greca alfa. Una domanda che sorge in una classe di statistica è: "Quale valore di alfa dovrebbe essere usato per i nostri test di ipotesi?"

La risposta a questa domanda, come con molte altre domande in statistica è: "Dipende dalla situazione". Esploreremo cosa intendiamo con questo. Molte riviste di diverse discipline definiscono che i risultati statisticamente significativi sono quelli per i quali l'alfa è pari allo 0,05 o al 5%. Ma il punto principale da notare è che non esiste un valore universale di alfa che dovrebbe essere usato per tutti i test statistici.

Livelli di significatività comunemente usati

Il numero rappresentato da alfa è una probabilità, quindi può assumere un valore di qualsiasi numero reale non negativo inferiore a uno. Sebbene in teoria qualsiasi numero compreso tra 0 e 1 possa essere utilizzato per l'alfa, quando si tratta di pratica statistica questo non è il caso. Di tutti i livelli di significatività, i valori di 0,10, 0,05 e 0,01 sono quelli più comunemente usati per l'alfa. Come vedremo, potrebbero esserci ragioni per utilizzare valori di alfa diversi dai numeri più comunemente usati.

Livello di significatività ed errori di tipo I.

Una considerazione a fronte di un valore "taglia unica" per l'alfa ha a che fare con la probabilità di questo numero. Il livello di significatività di un test di ipotesi è esattamente uguale alla probabilità di un errore di tipo I. Un errore di tipo I consiste nel rifiutare erroneamente l'ipotesi nulla quando l'ipotesi nulla è effettivamente vera. Più piccolo è il valore di alfa, meno è probabile che rifiutiamo una vera ipotesi nulla.

Esistono diversi casi in cui è più accettabile un errore di tipo I. Un valore maggiore di alfa, anche uno maggiore di 0,10 può essere appropriato quando un valore minore di alfa risulta in un risultato meno desiderabile.

Nello screening medico per una malattia, considerare le possibilità di un test che falsamente risulta positivo per una malattia con uno che falsamente risulta negativo per una malattia. Un falso positivo provocherà ansia per il nostro paziente, ma porterà ad altri test che determineranno che il verdetto del nostro test è stato effettivamente errato. Un falso negativo darà al nostro paziente l'erroneo presupposto che non ha una malattia quando in effetti lo fa. Il risultato è che la malattia non sarà curata. Data la scelta, preferiremmo avere condizioni che risultino in un falso positivo piuttosto che in un falso negativo.

In questa situazione, accetteremmo volentieri un valore maggiore per l'alfa se si traducesse in un compromesso di una minore probabilità di un falso negativo.

Livello di significatività e valori P

Un livello di significatività è un valore che impostiamo per determinare la significatività statistica. Questo finisce per essere lo standard in base al quale misuriamo il valore p calcolato della nostra statistica di test. Dire che un risultato è statisticamente significativo a livello alfa significa semplicemente che il valore p è inferiore a alfa. Ad esempio, per un valore alfa = 0,05, se il valore p è maggiore di 0,05, allora non riusciamo a respingere l'ipotesi nulla.

Ci sono alcuni casi in cui avremmo bisogno di un valore p molto piccolo per rifiutare un'ipotesi nulla. Se la nostra ipotesi nulla riguarda qualcosa che è ampiamente accettato come vero, allora ci deve essere un alto grado di evidenza a favore del rifiuto dell'ipotesi nulla. Questo è fornito da un valore p che è molto più piccolo dei valori comunemente usati per l'alfa.

Conclusione

Non esiste un valore di alfa che determini il significato statistico. Sebbene numeri come 0.10, 0.05 e 0.01 siano valori comunemente usati per l'alfa, non esiste un teorema matematico prevalente che dice che questi sono gli unici livelli di significato che possiamo usare. Come per molte cose nelle statistiche, dobbiamo pensare prima di calcolare e soprattutto usare il buon senso.

Scienza