Stimatori non distorti e distorti

Uno degli obiettivi delle statistiche inferenziali è stimare parametri di popolazione sconosciuti. Questa stima viene eseguita costruendo intervalli di confidenza da campioni statistici. Una domanda diventa: "Quanto è buono uno stimatore?" In altre parole, "Quanto è accurato il nostro processo statistico, a lungo termine, di stimare il parametro della nostra popolazione. Un modo per determinare il valore di uno stimatore è considerare se è imparziale. Questa analisi ci richiede di trovare il valore atteso della nostra statistica.

Parametri e statistiche

Iniziamo considerando parametri e statistiche. Consideriamo variabili casuali da un tipo noto di distribuzione, ma con un parametro sconosciuto in questa distribuzione. Questo parametro faceva parte di una popolazione o poteva far parte di una funzione di densità di probabilità. Abbiamo anche una funzione delle nostre variabili casuali, e questa è chiamata statistica. La statistica (X1, X2,… , Xn) stima il parametro T, e quindi lo chiamiamo stimatore di T.

Stimatori non distorti e distorti

Definiamo ora stimatori imparziali e distorti. Vogliamo che il nostro stimatore corrisponda al nostro parametro, a lungo termine. In un linguaggio più preciso vogliamo che il valore atteso della nostra statistica sia uguale al parametro. Se questo è il caso, allora diciamo che la nostra statistica è uno stimatore imparziale del parametro.

Se uno stimatore non è uno stimatore imparziale, allora è uno stimatore distorto. Sebbene uno stimatore distorto non abbia un buon allineamento del suo valore atteso con il suo parametro, ci sono molti casi pratici in cui uno stimatore distorto può essere utile. Uno di questi casi è quando viene utilizzato un intervallo di confidenza più quattro per costruire un intervallo di confidenza per una proporzione di popolazione.

Esempio di mezzi

Per vedere come funziona questa idea, esamineremo un esempio pertinente alla media. La statistica

(X1 + X2 +... + Xn) / N

è nota come media campionaria. Supponiamo che le variabili casuali siano un campione casuale dalla stessa distribuzione con media μ. Ciò significa che il valore atteso di ciascuna variabile casuale è μ.

Quando calcoliamo il valore atteso della nostra statistica, vediamo quanto segue:

EX1 + X2 +... + Xn) / n] = (E [X1] + E [X2] +… + E [Xn]) / n = (nE [X1]) / n = E [X1] = μ.

Poiché il valore atteso della statistica corrisponde al parametro stimato, ciò significa che la media del campione è uno stimatore imparziale per la media della popolazione.