Quando la deviazione standard è uguale a zero?

La deviazione standard del campione è una statistica descrittiva che misura la diffusione di un set di dati quantitativi. Questo numero può essere qualsiasi numero reale non negativo. Dato che zero è un numero reale non negativo, sembra utile chiedere: "Quando la deviazione standard del campione sarà uguale a zero?" Esploreremo i motivi per cui.

Descrizione della deviazione standard

Due domande importanti a cui generalmente vogliamo rispondere su un set di dati includono:

  • Qual è il centro del set di dati?
  • Come è distribuito l'insieme di dati?

Esistono diverse misurazioni, chiamate statistiche descrittive che rispondono a queste domande. Ad esempio, il centro dei dati, noto anche come media, può essere descritto in termini di media, mediana o modalità. Altre statistiche, che sono meno note, possono essere usate come il midhinge o il trimean.

Per la diffusione dei nostri dati, potremmo utilizzare l'intervallo, l'intervallo interquartile o la deviazione standard. La deviazione standard è associata al mezzo per quantificare la diffusione dei nostri dati. Possiamo quindi utilizzare questo numero per confrontare più set di dati. Maggiore è la nostra deviazione standard, quindi maggiore è la diffusione.

Intuizione

Quindi consideriamo da questa descrizione cosa significherebbe avere una deviazione standard di zero. Ciò indicherebbe che non esiste alcuna diffusione nel nostro set di dati. Tutti i singoli valori dei dati verrebbero raggruppati in un unico valore. Dal momento che ci sarebbe un solo valore che i nostri dati potrebbero avere, questo valore costituirebbe la media del nostro campione.

In questa situazione, quando tutti i nostri valori dei dati sono uguali, non ci sarebbe alcuna variazione. Intuitivamente ha senso che la deviazione standard di un tale set di dati sarebbe zero.

Prova matematica

La deviazione standard del campione è definita da una formula. Quindi qualsiasi affermazione come quella sopra dovrebbe essere dimostrata usando questa formula. Iniziamo con un set di dati che si adatta alla descrizione sopra: tutti i valori sono identici e ci sono n valori uguali a X.

Calcoliamo la media di questo set di dati e vediamo che lo è

 X = (X + X +... + X) /n = nx/n = X.

Ora, quando calcoliamo le singole deviazioni dalla media, vediamo che tutte queste deviazioni sono zero. Di conseguenza, anche la varianza e anche la deviazione standard sono uguali a zero.

Necessario e sufficiente

Vediamo che se il set di dati non mostra alcuna variazione, la sua deviazione standard è zero. Potremmo chiederci se è vero anche il contrario di questa affermazione. Per vedere se lo è, useremo di nuovo la formula per la deviazione standard. Questa volta, tuttavia, imposteremo la deviazione standard uguale a zero. Non faremo ipotesi sul nostro set di dati, ma vedremo quale impostazione S = 0 implica

Supponiamo che la deviazione standard di un set di dati sia uguale a zero. Ciò implicherebbe che la varianza del campione S2 è anche uguale a zero. Il risultato è l'equazione:

0 = (1 / (n - 1)) ∑ (Xio - X )2

Moltiplichiamo entrambi i lati dell'equazione per n - 1 e vedere che la somma delle deviazioni al quadrato è uguale a zero. Dato che stiamo lavorando con numeri reali, l'unico modo per far sì che ciò avvenga è che ciascuna delle deviazioni al quadrato sia uguale a zero. Questo significa che per tutti io, il termine (Xio - X )2 = 0.

Ora prendiamo la radice quadrata dell'equazione sopra e vediamo che ogni deviazione dalla media deve essere uguale a zero. Da allora per tutti io,

Xio - X = 0

Ciò significa che ogni valore di dati è uguale alla media. Questo risultato insieme a quello sopra ci consente di dire che la deviazione standard del campione di un set di dati è zero se e solo se tutti i suoi valori sono identici.