Quante calorie abbiamo mangiato a colazione? Quanto lontano da casa hanno viaggiato oggi tutti? Quanto è grande il posto che chiamiamo casa? Quante altre persone lo chiamano casa? Per dare un senso a tutte queste informazioni, sono necessari determinati strumenti e modi di pensare. La scienza matematica chiamata statistica è ciò che ci aiuta a gestire questo sovraccarico di informazioni.
La statistica è lo studio di informazioni numeriche, chiamate dati. Gli statistici acquisiscono, organizzano e analizzano i dati. Ogni parte di questo processo è anche esaminata. Le tecniche di statistica sono applicate a una moltitudine di altre aree di conoscenza. Di seguito è un'introduzione ad alcuni dei principali argomenti delle statistiche.
Uno dei temi ricorrenti della statistica è che siamo in grado di dire qualcosa su un grande gruppo basato sullo studio di una porzione relativamente piccola di quel gruppo. Il gruppo nel suo insieme è noto come la popolazione. La parte del gruppo che studiamo è il campione.
Ad esempio, supponiamo di voler conoscere l'altezza media delle persone che vivono negli Stati Uniti. Potremmo provare a misurare oltre 300 milioni di persone, ma ciò sarebbe impossibile. Sarebbe un incubo logistico condurre le misurazioni in modo tale che nessuno sia mancato e nessuno sia stato contato due volte.
A causa della natura impossibile di misurare tutti negli Stati Uniti, potremmo invece utilizzare le statistiche. Invece di trovare le altezze di tutti nella popolazione, prendiamo un campione statistico di alcune migliaia. Se abbiamo campionato correttamente la popolazione, l'altezza media del campione sarà molto vicina all'altezza media della popolazione.
Per trarre buone conclusioni, abbiamo bisogno di buoni dati con cui lavorare. Il modo in cui campioniamo una popolazione per ottenere questi dati dovrebbe sempre essere esaminato. Il tipo di campione che utilizziamo dipende dalla domanda che stiamo ponendo sulla popolazione. I campioni più comunemente usati sono:
È altrettanto importante sapere come viene condotta la misurazione del campione. Per tornare all'esempio sopra, come acquisiamo le altezze di quelle nel nostro campione?
Ognuno di questi modi per ottenere i dati ha i suoi vantaggi e svantaggi. Chiunque utilizzi i dati di questo studio vorrebbe sapere come sono stati ottenuti.
A volte c'è una moltitudine di dati e possiamo letteralmente perdersi in tutti i dettagli. È difficile vedere la foresta per gli alberi. Ecco perché è importante mantenere ben organizzati i nostri dati. Un'organizzazione attenta e la visualizzazione grafica dei dati ci aiutano a individuare modelli e tendenze prima di eseguire effettivamente i calcoli.
Dal momento che presentiamo graficamente i nostri dati dipende da una varietà di fattori. I grafici comuni sono:
Oltre a questi grafici ben noti, ce ne sono altri che vengono utilizzati in situazioni specializzate.
Un modo per analizzare i dati è chiamato statistica descrittiva. Qui l'obiettivo è calcolare le quantità che descrivono i nostri dati. I numeri chiamati media, mediana e modalità sono tutti usati per indicare la media o il centro dei dati. L'intervallo e la deviazione standard vengono utilizzati per indicare la diffusione dei dati. Tecniche più complicate, come la correlazione e la regressione, descrivono i dati associati.
Quando iniziamo con un campione e poi proviamo a dedurre qualcosa sulla popolazione, stiamo usando le statistiche inferenziali. Nel lavorare con quest'area delle statistiche, si pone l'argomento del test delle ipotesi. Qui vediamo la natura scientifica dell'argomento della statistica, mentre affermiamo un'ipotesi, quindi usiamo strumenti statistici con il nostro campione per determinare la probabilità che dobbiamo respingere l'ipotesi o meno. Questa spiegazione in realtà sta solo graffiando la superficie di questa parte molto utile delle statistiche.
Non è esagerato affermare che gli strumenti statistici sono utilizzati da quasi tutti i campi della ricerca scientifica. Ecco alcune aree che dipendono fortemente dalle statistiche:
Sebbene alcuni considerino la statistica come una branca della matematica, è meglio pensarla come una disciplina fondata sulla matematica. In particolare, le statistiche sono costruite dal campo della matematica noto come probabilità. La probabilità ci dà un modo per determinare la probabilità che si verifichi un evento. Ci dà anche un modo di parlare di casualità. Questa è la chiave per le statistiche perché il campione tipico deve essere selezionato casualmente dalla popolazione.
La probabilità fu studiata per la prima volta nel 1700 da matematici come Pascal e Fermat. Il 1700 segnò anche l'inizio delle statistiche. Le statistiche continuarono a crescere dalle sue radici probabilistiche e decollarono davvero nel 1800. Oggi, la sua portata teorica continua ad essere ampliata in ciò che è noto come statistica matematica.