Qual è la distribuzione normale standard?

Le curve della campana vengono visualizzate attraverso le statistiche. Diverse misure come diametri di semi, lunghezze di pinne di pesce, punteggi sul SAT e pesi di singoli fogli di una risma di carta formano tutte le curve a campana quando sono rappresentate graficamente. La forma generale di tutte queste curve è la stessa. Ma tutte queste curve sono diverse perché è altamente improbabile che ognuna di esse condivida la stessa media o deviazione standard. Le curve di campana con grandi deviazioni standard sono ampie e le curve di campana con piccole deviazioni standard sono magre. Le curve a campana con mezzi più grandi sono spostate più a destra rispetto a quelle con mezzi più piccoli.

Un esempio

Per renderlo un po 'più concreto, facciamo finta di misurare i diametri di 500 chicchi di mais. Quindi registriamo, analizziamo e rappresentiamo graficamente tali dati. Si è riscontrato che il set di dati ha la forma di una curva a campana e ha una media di 1,2 cm con una deviazione standard di .4 cm. Supponiamo ora di fare la stessa cosa con 500 fagioli e scopriamo che hanno un diametro medio di .8 cm con una deviazione standard di 0,04 cm.

Le curve di campana di entrambi questi set di dati sono tracciate sopra. La curva rossa corrisponde ai dati del mais e la curva verde corrisponde ai dati del bean. Come possiamo vedere, i centri e gli spread di queste due curve sono diversi.

Queste sono chiaramente due diverse curve di campana. Sono diversi perché i loro mezzi e le deviazioni standard non corrispondono. Poiché qualsiasi set di dati interessante che incontriamo può avere qualsiasi numero positivo come deviazione standard e qualsiasi numero per una media, stiamo davvero grattando la superficie di un infinito numero di curve campanarie. Sono molte curve e troppe da affrontare. Qual è la soluzione?

Una curva a campana molto speciale

Un obiettivo della matematica è generalizzare le cose ogni volta che è possibile. A volte diversi problemi individuali sono casi speciali di un singolo problema. Questa situazione che coinvolge le curve a campana ne è un esempio. Invece di affrontare un numero infinito di curve a campana, possiamo collegarle tutte a una singola curva. Questa speciale curva a campana è chiamata curva a campana standard o distribuzione normale standard.

La curva a campana standard ha una media di zero e una deviazione standard di una. Qualsiasi altra curva a campana può essere paragonata a questo standard mediante un semplice calcolo.

Caratteristiche della distribuzione normale standard

Tutte le proprietà di qualsiasi curva a campana valgono per la distribuzione normale standard.

  • La distribuzione normale standard non ha solo una media di zero ma anche una mediana e una modalità di zero. Questo è il centro della curva.
  • La distribuzione normale standard mostra la simmetria specchio a zero. La metà della curva è a sinistra di zero e la metà della curva è a destra. Se la curva fosse piegata lungo una linea verticale a zero, entrambe le metà corrisponderebbero perfettamente.
  • La distribuzione normale standard segue la regola 68-95-99.7, che ci fornisce un modo semplice per stimare quanto segue:
    • Circa il 68% di tutti i dati è compreso tra -1 e 1.
    • Circa il 95% di tutti i dati è compreso tra -2 e 2.
    • Circa il 99,7% di tutti i dati è compreso tra -3 e 3.

Perché ci preoccupiamo

A questo punto, potremmo chiederci: "Perché preoccuparsi di una curva a campana standard?" Potrebbe sembrare una complicazione inutile, ma la curva a campana standard sarà utile mentre continuiamo nelle statistiche.

Scopriremo che un tipo di problema nelle statistiche ci impone di trovare aree al di sotto di porzioni di qualsiasi curva a campana che incontriamo. La curva a campana non è una bella forma per le aree. Non è come un rettangolo o un triangolo rettangolo con formule di area facili. Trovare aree di parti di una curva a campana può essere difficile, così difficile, infatti, che avremmo bisogno di usare qualche calcolo. Se non standardizziamo le nostre curve a campana, dovremmo fare qualche calcolo ogni volta che vogliamo trovare un'area. Se standardizziamo le nostre curve, tutto il lavoro di calcolo delle aree è stato svolto per noi.