L'approssimazione normale alla distribuzione binomiale

Le variabili casuali con una distribuzione binomiale sono note per essere discrete. Ciò significa che esiste un numero numerabile di risultati che possono verificarsi in una distribuzione binomiale, con separazione tra questi risultati. Ad esempio, una variabile binomiale può assumere un valore di tre o quattro, ma non un numero compreso tra tre e quattro.

Con il carattere discreto di una distribuzione binomiale, è piuttosto sorprendente che una variabile casuale continua possa essere utilizzata per approssimare una distribuzione binomiale. Per molte distribuzioni binomiali, possiamo usare una distribuzione normale per approssimare le nostre probabilità binomiali.

Questo può essere visto guardando n lancio e lancio di monete X essere il numero di teste. In questa situazione, abbiamo una distribuzione binomiale con probabilità di successo come p = 0,5. Man mano che aumentiamo il numero di lanci, vediamo che l'istogramma di probabilità assomiglia sempre più a una distribuzione normale.

Dichiarazione dell'approssimazione normale

Ogni distribuzione normale è completamente definita da due numeri reali. Questi numeri sono la media, che misura il centro della distribuzione, e la deviazione standard, che misura la diffusione della distribuzione. Per una determinata situazione binomiale dobbiamo essere in grado di determinare quale distribuzione normale usare.

La selezione della corretta distribuzione normale è determinata dal numero di prove n nell'impostazione binomiale e la costante probabilità di successo p per ognuna di queste prove. L'approssimazione normale per la nostra variabile binomiale è una media di np e una deviazione standard di (np(1 - p)0.5.

Ad esempio, supponiamo di aver indovinato ciascuna delle 100 domande di un test a scelta multipla, in cui ogni domanda aveva una risposta corretta su quattro scelte. Il numero di risposte corrette X è una variabile casuale binomiale con n = 100 e p = 0,25. Pertanto questa variabile casuale ha una media di 100 (0,25) = 25 e una deviazione standard di (100 (0,25) (0,75))0.5 = 4.33. Una distribuzione normale con media 25 e deviazione standard di 4,33 funzionerà per approssimare questa distribuzione binomiale.

Quando è l'approssimazione appropriata?

Usando un po 'di matematica si può dimostrare che ci sono alcune condizioni che dobbiamo usare una normale approssimazione alla distribuzione binomiale. Il numero di osservazioni n deve essere abbastanza grande e il valore di p in modo che entrambi np e n(1 - p) sono maggiori o uguali a 10. Questa è una regola empirica, che è guidata dalla pratica statistica. L'approssimazione normale può sempre essere usata, ma se queste condizioni non sono soddisfatte, l'approssimazione potrebbe non essere così buona di un'approssimazione.

Ad esempio, se n = 100 e p = 0,25 quindi siamo giustificati nell'usare l'approssimazione normale. Questo è perché np = 25 e n(1 - p) = 75. Poiché entrambi questi numeri sono maggiori di 10, la distribuzione normale appropriata farà un buon lavoro di stima delle probabilità binomiali.

Perché usare l'approssimazione?

Le probabilità binomiali sono calcolate usando una formula molto semplice per trovare il coefficiente binomiale. Sfortunatamente, a causa dei fattoriali nella formula, può essere molto facile imbattersi in difficoltà computazionali con la formula binomiale. L'approssimazione normale ci consente di aggirare uno di questi problemi lavorando con un amico familiare, una tabella di valori di una distribuzione normale standard.

Molte volte la determinazione di una probabilità che una variabile casuale binomiale rientri in un intervallo di valori è noiosa da calcolare. Questo perché si trova la probabilità che una variabile binomiale X è maggiore di 3 e minore di 10, dovremmo trovare la probabilità che X è uguale a 4, 5, 6, 7, 8 e 9, quindi somma tutte queste probabilità insieme. Se è possibile utilizzare l'approssimazione normale, sarà invece necessario determinare i punteggi z corrispondenti a 3 e 10, quindi utilizzare una tabella di probabilità z per la distribuzione normale standard.