La pratica statistica dei test di ipotesi è diffusa non solo nelle statistiche ma anche nelle scienze naturali e sociali. Quando conduciamo un test di ipotesi ci sono un paio di cose che potrebbero andare storte. Esistono due tipi di errori, che in base alla progettazione non possono essere evitati e dobbiamo essere consapevoli del fatto che tali errori esistono. Agli errori vengono dati nomi abbastanza pedonali di errori di tipo I e di tipo II. Cosa sono gli errori di tipo I e di tipo II e come li distinguiamo? Brevemente:
Esploreremo più retroscena dietro questi tipi di errori con l'obiettivo di comprendere queste affermazioni.
Il processo di verifica delle ipotesi può sembrare abbastanza vario con una moltitudine di statistiche di prova. Ma il processo generale è lo stesso. Il test di ipotesi implica l'affermazione di un'ipotesi nulla e la selezione di un livello di significatività. L'ipotesi nulla è vera o falsa e rappresenta l'affermazione predefinita per un trattamento o una procedura. Ad esempio, quando si esamina l'efficacia di un farmaco, l'ipotesi nulla sarebbe che il farmaco non abbia alcun effetto su una malattia.
Dopo aver formulato l'ipotesi nulla e aver scelto un livello di significatività, acquisiamo dati attraverso l'osservazione. I calcoli statistici ci dicono se dovremmo o meno rifiutare l'ipotesi nulla.
In un mondo ideale, rifiuteremmo sempre l'ipotesi nulla quando è falsa e non rifiuteremmo l'ipotesi nulla quando è effettivamente vera. Ma ci sono altri due scenari possibili, ognuno dei quali comporterà un errore.
Il primo tipo di errore possibile comporta il rifiuto di un'ipotesi nulla che sia effettivamente vera. Questo tipo di errore viene chiamato errore di tipo I e talvolta viene chiamato errore del primo tipo.
Gli errori di tipo I equivalgono a falsi positivi. Torniamo all'esempio di un farmaco usato per curare una malattia. Se rifiutiamo l'ipotesi nulla in questa situazione, allora la nostra affermazione è che il farmaco ha, in effetti, qualche effetto su una malattia. Ma se l'ipotesi nulla è vera, allora, in realtà, il farmaco non combatte affatto la malattia. Si afferma che il farmaco ha un effetto positivo su una malattia.
Gli errori di tipo I possono essere controllati. Il valore di alfa, che è correlato al livello di significatività che abbiamo selezionato, ha un rapporto diretto con gli errori di tipo I. Alpha è la massima probabilità che si verifichi un errore di tipo I. Per un livello di confidenza del 95%, il valore di alfa è 0,05. Ciò significa che esiste una probabilità del 5% di rifiutare una vera ipotesi nulla. A lungo termine, uno su venti test di ipotesi che eseguiamo a questo livello comporterà un errore di tipo I..
L'altro tipo di errore possibile si verifica quando non rifiutiamo un'ipotesi nulla che sia falsa. Questo tipo di errore è chiamato errore di tipo II e viene anche definito errore del secondo tipo.
Gli errori di tipo II equivalgono a falsi negativi. Se ripensiamo allo scenario in cui stiamo testando un farmaco, quale sarebbe un errore di tipo II? Si verificherebbe un errore di tipo II se accettassimo che il farmaco non ha avuto alcun effetto su una malattia, ma in realtà lo ha fatto.
La probabilità di un errore di tipo II è data dalla lettera greca beta. Questo numero è correlato alla potenza o alla sensibilità del test di ipotesi, indicato con 1 - beta.
Gli errori di tipo I e di tipo II fanno parte del processo di verifica delle ipotesi. Sebbene gli errori non possano essere completamente eliminati, possiamo ridurre al minimo un tipo di errore.
In genere, quando proviamo a ridurre la probabilità di un tipo di errore, aumenta la probabilità per l'altro tipo. Potremmo ridurre il valore di alfa da 0,05 a 0,01, corrispondente a un livello di confidenza del 99%. Tuttavia, se tutto il resto rimane lo stesso, allora la probabilità di un errore di tipo II aumenterà quasi sempre.
Molte volte l'applicazione del nostro test di ipotesi nel mondo reale determinerà se accettiamo più errori di tipo I o di tipo II. Questo verrà quindi utilizzato quando progettiamo il nostro esperimento statistico.