Il teorema del limite centrale è il risultato della teoria della probabilità. Questo teorema si presenta in diversi punti nel campo della statistica. Sebbene il teorema del limite centrale possa sembrare astratto e privo di qualsiasi applicazione, questo teorema è in realtà abbastanza importante per la pratica della statistica.
Allora, qual è esattamente l'importanza del teorema del limite centrale? Tutto ha a che fare con la distribuzione della nostra popolazione. Questo teorema ti consente di semplificare i problemi nelle statistiche permettendoti di lavorare con una distribuzione approssimativamente normale.
L'affermazione del teorema del limite centrale può sembrare abbastanza tecnica ma può essere compresa se pensiamo attraverso i seguenti passaggi. Iniziamo con un semplice campione casuale con n individui di una popolazione di interesse. Da questo campione, possiamo facilmente formare una media campione che corrisponde alla media di quale misurazione siamo curiosi nella nostra popolazione.
Una distribuzione di campionamento per la media campionaria viene prodotta selezionando ripetutamente campioni casuali semplici della stessa popolazione e della stessa dimensione, quindi calcolando la media campionaria per ciascuno di questi campioni. Questi campioni devono essere considerati indipendenti l'uno dall'altro.
Il teorema del limite centrale riguarda la distribuzione campionaria dei mezzi di campionamento. Potremmo chiedere informazioni sulla forma generale della distribuzione del campionamento. Il teorema del limite centrale afferma che questa distribuzione di campionamento è approssimativamente normale, comunemente nota come curva a campana. Questa approssimazione migliora man mano che aumentiamo le dimensioni dei semplici campioni casuali utilizzati per produrre la distribuzione di campionamento.
C'è una caratteristica molto sorprendente riguardo al teorema del limite centrale. Il fatto sorprendente è che questo teorema afferma che una distribuzione normale sorge indipendentemente dalla distribuzione iniziale. Anche se la nostra popolazione ha una distribuzione distorta, che si verifica quando esaminiamo cose come redditi o pesi delle persone, una distribuzione campionaria per un campione con una dimensione del campione sufficientemente grande sarà normale.
L'apparizione inattesa di una distribuzione normale da una distribuzione della popolazione distorta (anche piuttosto fortemente distorta) ha alcune applicazioni molto importanti nella pratica statistica. Molte pratiche statistiche, come quelle che coinvolgono test di ipotesi o intervalli di confidenza, fanno alcune ipotesi riguardanti la popolazione da cui i dati sono stati ottenuti. Un presupposto che viene inizialmente fatto in un corso di statistica è che le popolazioni con cui lavoriamo sono normalmente distribuite.
Il presupposto che i dati provengano da una distribuzione normale semplifica le cose ma sembra un po 'irrealistico. Solo un piccolo lavoro con alcuni dati del mondo reale mostra che valori anomali, asimmetria, più picchi e asimmetria si presentano abbastanza regolarmente. Possiamo aggirare il problema dei dati di una popolazione che non è normale. L'uso di una dimensione del campione appropriata e il teorema del limite centrale ci aiutano a aggirare il problema dei dati provenienti da popolazioni non normali.
Pertanto, anche se potremmo non conoscere la forma della distribuzione da cui provengono i nostri dati, il teorema del limite centrale afferma che possiamo trattare la distribuzione di campionamento come se fosse normale. Naturalmente, affinché le conclusioni del teorema siano valide, abbiamo bisogno di una dimensione del campione sufficientemente grande. L'analisi dei dati esplorativi può aiutarci a determinare l'ampiezza di un campione necessario per una determinata situazione.