Varianza e deviazione standard

Quando misuriamo la variabilità di un insieme di dati, ci sono due statistiche strettamente correlate correlate a questo: la varianza e la deviazione standard, che indicano entrambe la diffusione dei valori dei dati e comportano passaggi simili nel loro calcolo. Tuttavia, la principale differenza tra queste due analisi statistiche è che la deviazione standard è la radice quadrata della varianza.

Per comprendere le differenze tra queste due osservazioni sulla diffusione statistica, bisogna prima capire cosa rappresenta ciascuna: la varianza rappresenta tutti i punti di dati in un insieme e viene calcolata facendo la media della deviazione al quadrato di ciascuna media mentre la deviazione standard è una misura della diffusione intorno alla media quando la tendenza centrale viene calcolata tramite la media.

Di conseguenza, la varianza può essere espressa come la deviazione quadrata media dei valori dalle medie o [deviazione quadrata delle medie] divisa per il numero di osservazioni e la deviazione standard può essere espressa come radice quadrata della varianza.

Costruzione della varianza

Per comprendere appieno la differenza tra queste statistiche è necessario comprendere il calcolo della varianza. I passaggi per il calcolo della varianza del campione sono i seguenti:

  1. Calcola la media campionaria dei dati.
  2. Trova la differenza tra la media e ciascuno dei valori dei dati.
  3. Piazza queste differenze.
  4. Aggiungi le differenze quadrate insieme.
  5. Dividi questa somma per uno in meno del numero totale di valori di dati.

I motivi di ciascuno di questi passaggi sono i seguenti:

  1. La media fornisce il punto centrale o la media dei dati.
  2. Le differenze dalla media aiutano a determinare le deviazioni da quella media. I valori dei dati che sono lontani dalla media produrranno una deviazione maggiore rispetto a quelli vicini alla media.
  3. Le differenze sono quadrate perché se le differenze vengono aggiunte senza essere quadrate, questa somma sarà zero.
  4. L'aggiunta di queste deviazioni quadrate fornisce una misurazione della deviazione totale.
  5. La divisione per uno in meno della dimensione del campione fornisce una sorta di deviazione media. Questo nega l'effetto di avere molti punti dati ognuno dei quali contribuisce alla misurazione della diffusione.

Come affermato in precedenza, la deviazione standard viene semplicemente calcolata trovando la radice quadrata di questo risultato, che fornisce lo standard assoluto di deviazione indipendentemente dal numero totale di valori di dati.

Varianza e deviazione standard

Quando consideriamo la varianza, ci rendiamo conto che c'è un grosso svantaggio nell'usarlo. Quando seguiamo i passaggi del calcolo della varianza, questo mostra che la varianza viene misurata in termini di unità quadrate perché abbiamo aggiunto insieme differenze quadrate nel nostro calcolo. Ad esempio, se i nostri dati di esempio vengono misurati in termini di metri, le unità per una varianza verrebbero fornite in metri quadrati.

Per standardizzare la nostra misura di diffusione, dobbiamo prendere la radice quadrata della varianza. Questo eliminerà il problema delle unità quadrate e ci darà una misura della diffusione che avrà le stesse unità del nostro campione originale.

Esistono molte formule nelle statistiche matematiche che hanno forme più belle quando le dichiariamo in termini di varianza anziché deviazione standard.