L'uso degli intervalli di confidenza nelle statistiche inferenziali

Le statistiche inferenziali prendono il nome da ciò che accade in questo ramo di statistiche. Piuttosto che descrivere semplicemente un insieme di dati, le statistiche inferenziali cercano di inferire qualcosa su una popolazione sulla base di un campione statistico. Un obiettivo specifico nelle statistiche inferenziali prevede la determinazione del valore di un parametro di popolazione sconosciuto. L'intervallo di valori che utilizziamo per stimare questo parametro è chiamato intervallo di confidenza.

La forma di un intervallo di confidenza

Un intervallo di confidenza è composto da due parti. La prima parte è la stima del parametro di popolazione. Otteniamo questa stima utilizzando un semplice campione casuale. Da questo esempio, calcoliamo la statistica che corrisponde al parametro che desideriamo stimare. Ad esempio, se fossimo interessati all'altezza media di tutti gli studenti della prima elementare negli Stati Uniti, utilizzeremmo un semplice campione casuale di alunni della prima elementare degli Stati Uniti, misurandoli tutti e poi calcolando l'altezza media del nostro campione.

La seconda parte di un intervallo di confidenza è il margine di errore. Ciò è necessario perché la nostra sola stima potrebbe essere diversa dal vero valore del parametro popolazione. Per consentire altri potenziali valori del parametro, dobbiamo produrre un intervallo di numeri. Il margine di errore fa questo e ogni intervallo di confidenza è nella seguente forma:

Stima ± margine di errore

La stima è al centro dell'intervallo, quindi sottraggiamo e aggiungiamo il margine di errore da questa stima per ottenere un intervallo di valori per il parametro.

Livello di confidenza

Ad ogni intervallo di confidenza è associato un livello di confidenza. Questa è una probabilità o percentuale che indica quanta certezza dovremmo essere attribuiti al nostro intervallo di confidenza. Se tutti gli altri aspetti di una situazione sono identici, maggiore è il livello di confidenza, maggiore è l'intervallo di confidenza.

Questo livello di fiducia può creare confusione. Non è una dichiarazione sulla procedura di campionamento o sulla popolazione. Invece, sta dando un'indicazione del successo del processo di costruzione di un intervallo di confidenza. Ad esempio, gli intervalli di confidenza con una confidenza dell'80 percento a lungo andare mancheranno il parametro della popolazione reale uno su ogni cinque volte.

Qualsiasi numero da zero a uno potrebbe, in teoria, essere utilizzato per un livello di confidenza. In pratica il 90 percento, il 95 percento e il 99 percento sono tutti livelli di confidenza comuni.

Margine di errore

Il margine di errore di un livello di confidenza è determinato da una coppia di fattori. Possiamo vederlo esaminando la formula per il margine di errore. Un margine di errore è nella forma:

Margine di errore = (Statistica per livello di confidenza) * (Deviazione / errore standard)

La statistica per il livello di confidenza dipende dalla distribuzione di probabilità utilizzata e dal livello di confidenza che abbiamo scelto. Ad esempio, se Cè il nostro livello di confidenza e stiamo lavorando con una distribuzione normale, quindi C è l'area sotto la curva tra -z* per z*. Questo numero z* è il numero nel nostro margine di formula di errore.

Deviazione standard o errore standard

L'altro termine necessario nel nostro margine di errore è la deviazione standard o l'errore standard. La deviazione standard della distribuzione con cui stiamo lavorando è preferita qui. Tuttavia, in genere i parametri della popolazione non sono noti. Questo numero non è di solito disponibile quando si formano in pratica intervalli di confidenza.

Per far fronte a questa incertezza nel conoscere la deviazione standard utilizziamo invece l'errore standard. L'errore standard che corrisponde a una deviazione standard è una stima di questa deviazione standard. Ciò che rende l'errore standard così potente è che viene calcolato dal semplice campione casuale utilizzato per calcolare la nostra stima. Non sono necessarie ulteriori informazioni poiché il campione esegue tutte le stime per noi.

Intervalli di confidenza diversi

Esistono diverse situazioni che richiedono intervalli di confidenza. Questi intervalli di confidenza vengono utilizzati per stimare un numero di parametri diversi. Sebbene questi aspetti siano diversi, tutti questi intervalli di confidenza sono uniti dallo stesso formato generale. Alcuni intervalli di confidenza comuni sono quelli per una media della popolazione, la varianza della popolazione, la proporzione della popolazione, la differenza di due medie della popolazione e la differenza di due proporzioni della popolazione.