Quando misuriamo la variabilità di un insieme di dati, ci sono due statistiche strettamente correlate correlate a questo: la varianza e la deviazione standard, che indicano entrambe la diffusione dei valori dei dati e comportano passaggi simili nel loro calcolo. Tuttavia, la principale differenza tra queste due analisi statistiche è che la deviazione standard è la radice quadrata della varianza.
Per comprendere le differenze tra queste due osservazioni sulla diffusione statistica, bisogna prima capire cosa rappresenta ciascuna: la varianza rappresenta tutti i punti di dati in un insieme e viene calcolata facendo la media della deviazione al quadrato di ciascuna media mentre la deviazione standard è una misura della diffusione intorno alla media quando la tendenza centrale viene calcolata tramite la media.
Di conseguenza, la varianza può essere espressa come la deviazione quadrata media dei valori dalle medie o [deviazione quadrata delle medie] divisa per il numero di osservazioni e la deviazione standard può essere espressa come radice quadrata della varianza.
Per comprendere appieno la differenza tra queste statistiche è necessario comprendere il calcolo della varianza. I passaggi per il calcolo della varianza del campione sono i seguenti:
I motivi di ciascuno di questi passaggi sono i seguenti:
Come affermato in precedenza, la deviazione standard viene semplicemente calcolata trovando la radice quadrata di questo risultato, che fornisce lo standard assoluto di deviazione indipendentemente dal numero totale di valori di dati.
Quando consideriamo la varianza, ci rendiamo conto che c'è un grosso svantaggio nell'usarlo. Quando seguiamo i passaggi del calcolo della varianza, questo mostra che la varianza viene misurata in termini di unità quadrate perché abbiamo aggiunto insieme differenze quadrate nel nostro calcolo. Ad esempio, se i nostri dati di esempio vengono misurati in termini di metri, le unità per una varianza verrebbero fornite in metri quadrati.
Per standardizzare la nostra misura di diffusione, dobbiamo prendere la radice quadrata della varianza. Questo eliminerà il problema delle unità quadrate e ci darà una misura della diffusione che avrà le stesse unità del nostro campione originale.
Esistono molte formule nelle statistiche matematiche che hanno forme più belle quando le dichiariamo in termini di varianza anziché deviazione standard.