Esistono molte distribuzioni di probabilità utilizzate nelle statistiche. Ad esempio, la distribuzione normale standard, o curva a campana, è probabilmente la più ampiamente riconosciuta. Le distribuzioni normali sono solo un tipo di distribuzione. Una distribuzione di probabilità molto utile per lo studio delle varianze di popolazione è chiamata distribuzione F. Esamineremo alcune delle proprietà di questo tipo di distribuzione.
La formula della densità di probabilità per la distribuzione F è piuttosto complicata. In pratica, non dobbiamo preoccuparci di questa formula. Tuttavia, può essere molto utile conoscere alcuni dettagli delle proprietà riguardanti la distribuzione F. Alcune delle caratteristiche più importanti di questa distribuzione sono elencate di seguito:
Queste sono alcune delle funzionalità più importanti e facilmente identificabili. Osserveremo più da vicino i gradi di libertà.
Una caratteristica condivisa dalle distribuzioni chi-quadro, dalle distribuzioni t e dalle distribuzioni F è che esiste davvero una famiglia infinita di ciascuna di queste distribuzioni. Una particolare distribuzione viene individuata conoscendo il numero di gradi di libertà. Per un t distribuzione, il numero di gradi di libertà è uno in meno della nostra dimensione del campione. Il numero di gradi di libertà per una distribuzione F è determinato in modo diverso rispetto a una distribuzione t o persino a una distribuzione chi-quadro.
Di seguito vedremo esattamente come sorge una distribuzione F. Per ora, considereremo abbastanza per determinare il numero di gradi di libertà. La distribuzione F è derivata da un rapporto che coinvolge due popolazioni. C'è un campione da ciascuna di queste popolazioni e quindi ci sono gradi di libertà per entrambi questi campioni. In effetti, ne sottraggiamo uno da entrambe le dimensioni del campione per determinare i nostri due numeri di gradi di libertà.
Le statistiche di queste popolazioni si combinano in una frazione della statistica F. Sia il numeratore che il denominatore hanno gradi di libertà. Invece di combinare questi due numeri in un altro numero, li conserviamo entrambi. Pertanto, qualsiasi utilizzo di una tabella di distribuzione F richiede che cerchiamo due diversi gradi di libertà.
La distribuzione F deriva da statistiche inferenziali riguardanti le variazioni della popolazione. Più specificamente, usiamo una distribuzione F quando stiamo studiando il rapporto tra le varianze di due popolazioni normalmente distribuite.
La distribuzione F non viene utilizzata esclusivamente per costruire intervalli di confidenza e testare ipotesi sulle variazioni della popolazione. Questo tipo di distribuzione viene anche utilizzato in un'analisi a un fattore di varianza (ANOVA). ANOVA si occupa di confrontare la variazione tra diversi gruppi e la variazione all'interno di ciascun gruppo. Per ottenere ciò, utilizziamo un rapporto di varianze. Questo rapporto di varianze ha la distribuzione F. Una formula alquanto complicata ci consente di calcolare una statistica F come statistica di prova.