Le distribuzioni di probabilità binomiali sono utili in numerose impostazioni. È importante sapere quando utilizzare questo tipo di distribuzione. Esamineremo tutte le condizioni necessarie per utilizzare una distribuzione binomiale.
Le caratteristiche di base che dobbiamo avere sono per un totale di n sono condotte prove indipendenti e vogliamo scoprire la probabilità di r successi, dove ogni successo ha probabilità p di accadere. Ci sono molte cose dichiarate e implicite in questa breve descrizione. La definizione si riduce a queste quattro condizioni:
Tutti questi devono essere presenti nel processo in esame al fine di utilizzare la formula o le tabelle di probabilità binomiale. Segue una breve descrizione di ciascuno di questi.
Il processo in esame deve avere un numero chiaramente definito di prove che non variano. Non possiamo modificare questo numero a metà della nostra analisi. Ogni prova deve essere eseguita allo stesso modo di tutte le altre, sebbene i risultati possano variare. Il numero di prove è indicato da un n nella formula.
Un esempio di prove fisse per un processo implicherebbe lo studio dei risultati del lancio di un dado dieci volte. Qui ogni lancio del dado è una prova. Il numero totale di volte in cui viene condotta ogni prova è definito dall'inizio.
Ciascuna delle prove deve essere indipendente. Ogni prova non dovrebbe assolutamente avere alcun effetto su nessuna delle altre. Gli esempi classici di lanciare due dadi o lanciare diverse monete illustrano eventi indipendenti. Poiché gli eventi sono indipendenti, siamo in grado di utilizzare la regola di moltiplicazione per moltiplicare le probabilità insieme.
In pratica, soprattutto a causa di alcune tecniche di campionamento, possono esserci momenti in cui le prove non sono tecnicamente indipendenti. Una distribuzione binomiale può talvolta essere usata in queste situazioni purché la popolazione sia più grande rispetto al campione.
Ciascuna delle prove è raggruppata in due classificazioni: successi e fallimenti. Sebbene in genere pensiamo al successo come una cosa positiva, non dovremmo leggere troppo in questo termine. Stiamo indicando che il processo è un successo in quanto si allinea a quello che abbiamo deciso di chiamare un successo.
Come caso estremo per illustrare questo, supponiamo che stiamo testando il tasso di guasto delle lampadine. Se vogliamo sapere quanti in un batch non funzioneranno, potremmo definire il successo della nostra prova quando avremo una lampadina che non funziona. Un fallimento del processo è quando la lampadina funziona. Questo può sembrare un po 'arretrato, ma ci possono essere alcuni buoni motivi per definire i successi e gli insuccessi della nostra prova, come abbiamo fatto. Può essere preferibile, ai fini della marcatura, sottolineare che esiste una bassa probabilità che una lampadina non funzioni piuttosto che un'alta probabilità di funzionamento di una lampadina.
Le probabilità di successo delle prove devono rimanere le stesse durante tutto il processo che stiamo studiando. Lanciare monete è un esempio di questo. Indipendentemente dal numero di monete lanciate, la probabilità di lanciare una testa è 1/2 ogni volta.
Questo è un altro posto in cui teoria e pratica sono leggermente diverse. Il campionamento senza sostituzione può far fluttuare leggermente le probabilità di ogni prova. Supponiamo che ci siano 20 cani da lepre su 1000 cani. La probabilità di scegliere un beagle a caso è 20/1000 = 0,020. Ora scegli di nuovo tra i cani rimanenti. Ci sono 19 cani da lepre su 999 cani. La probabilità di selezionare un altro beagle è 19/999 = 0,019. Il valore 0.2 è una stima appropriata per entrambi questi studi. Finché la popolazione è abbastanza grande, questo tipo di stima non pone problemi nell'uso della distribuzione binomiale.