Varianza e deviazione standard

La varianza e la deviazione standard sono due misure di variazione strettamente correlate che sentirai molto parlare di studi, riviste o lezioni di statistica. Sono due concetti di base e fondamentali nelle statistiche che devono essere compresi per comprendere la maggior parte degli altri concetti o procedure statistici. Di seguito, esamineremo quali sono e come trovare la varianza e la deviazione standard.

Key Takeaways: varianza e deviazione standard

  • La varianza e la deviazione standard ci mostrano quanto i punteggi in una distribuzione variano dalla media.
  • La deviazione standard è la radice quadrata della varianza.
  • Per piccoli set di dati, la varianza può essere calcolata manualmente, ma i programmi statistici possono essere utilizzati per set di dati più grandi.

Definizione

Per definizione, la varianza e la deviazione standard sono entrambe misure di variazione per le variabili del rapporto di intervallo. Descrivono quanta variazione o diversità c'è in una distribuzione. Sia la varianza che la deviazione standard aumentano o diminuiscono in base alla precisione con cui i punteggi si raggruppano intorno alla media.

La varianza è definita come la media delle deviazioni al quadrato dalla media. Per calcolare la varianza, devi prima sottrarre la media da ciascun numero e quindi quadrare i risultati per trovare le differenze al quadrato. Quindi trovi la media di quelle differenze al quadrato. Il risultato è la varianza.

La deviazione standard è una misura di come sono distribuiti i numeri in una distribuzione. Indica quanto, in media, ciascuno dei valori nella distribuzione si discosta dalla media o dal centro della distribuzione. Viene calcolato prendendo la radice quadrata della varianza.

Un esempio concettuale

La varianza e la deviazione standard sono importanti perché ci dicono cose sul set di dati che non possiamo imparare solo guardando la media o la media. Ad esempio, immagina di avere tre fratelli più piccoli: un fratello di 13 anni e due gemelli di 10. In questo caso, l'età media dei tuoi fratelli sarebbe di 11. Adesso immagina di avere tre fratelli di 17, 12 anni e 4. In questo caso, l'età media dei tuoi fratelli sarebbe comunque di 11 anni, ma la varianza e la deviazione standard sarebbero maggiori.

Un esempio quantitativo

Diciamo che vogliamo trovare la varianza e la deviazione standard dell'età nel tuo gruppo di 5 amici intimi. Le età di te e dei tuoi amici sono 25, 26, 27, 30 e 32.

Innanzitutto, dobbiamo trovare l'età media: (25 + 26 + 27 + 30 + 32) / 5 = 28.

Quindi, dobbiamo calcolare le differenze dalla media per ciascuno dei 5 amici.

25-28 = -3
26-28 = -2
27-28 = -1
30 - 28 = 2
32 - 28 = 4

Quindi, per calcolare la varianza, prendiamo ogni differenza dalla media, la quadriamo, quindi media il risultato.

Varianza = ((-3)2 + (-2)2 + (-1)2 + 22 + 42) / 5

= (9 + 4 + 1 + 4 + 16) / 5 = 6.8

Quindi, la varianza è 6,8. E la deviazione standard è la radice quadrata della varianza, che è 2,61. Ciò significa che, in media, tu e i tuoi amici siete a distanza di 2,61 anni.

Sebbene sia possibile calcolare manualmente la varianza per insiemi di dati più piccoli come questo, è possibile utilizzare anche programmi software statistici per calcolare la varianza e la deviazione standard.

Campione contro popolazione

Quando si eseguono test statistici, è importante essere consapevoli della differenza tra a popolazione e a campione. Per calcolare la deviazione standard (o varianza) di una popolazione, è necessario raccogliere misurazioni per tutti i membri del gruppo che si sta studiando; per un campione, raccoglieresti le misurazioni solo da un sottoinsieme della popolazione.

Nell'esempio sopra, abbiamo ipotizzato che il gruppo di cinque amici fosse una popolazione; se invece lo avessimo trattato come un campione, il calcolo della deviazione standard del campione e della varianza del campione sarebbe leggermente diverso (invece di dividere per la dimensione del campione per trovare la varianza, ne avremmo sottratto prima uno dalla dimensione del campione e quindi diviso per questo numero più piccolo).

Importanza della varianza e deviazione standard

La varianza e la deviazione standard sono importanti nelle statistiche, poiché servono come base per altri tipi di calcoli statistici. Ad esempio, la deviazione standard è necessaria per convertire i punteggi dei test in punteggi Z. Anche la varianza e la deviazione standard svolgono un ruolo importante quando si conducono test statistici come i test t.

Riferimenti

Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Statistica sociale per una società diversificata. Thousand Oaks, CA: Pine Forge Press.