La disuguaglianza di Chebyshev dice che almeno 1-1 /K2 dei dati di un campione deve rientrare in K deviazioni standard dalla media (qui K è un numero reale positivo maggiore di uno).
Qualsiasi set di dati che viene normalmente distribuito, o nella forma di una curva a campana, ha diverse funzionalità. Uno di questi riguarda la diffusione dei dati in relazione al numero di deviazioni standard dalla media. In una distribuzione normale, sappiamo che il 68% dei dati è una deviazione standard dalla media, il 95% è due deviazioni standard dalla media e circa il 99% è entro tre deviazioni standard dalla media.
Ma se il set di dati non è distribuito nella forma di una curva a campana, una quantità diversa potrebbe trovarsi all'interno di una deviazione standard. La disuguaglianza di Chebyshev fornisce un modo per sapere in quale frazione di dati rientra K deviazioni standard dalla media per qualunque set di dati.
Possiamo anche affermare la disuguaglianza sopra sostituendo la frase "dati da un campione" con distribuzione di probabilità. Questo perché la disuguaglianza di Chebyshev è il risultato della probabilità, che può quindi essere applicata alle statistiche.
È importante notare che questa disuguaglianza è un risultato che è stato dimostrato matematicamente. Non è come la relazione empirica tra la media e la modalità, o la regola empirica che collega l'intervallo e la deviazione standard.
Per illustrare la disuguaglianza, esamineremo alcuni valori di K:
Supponiamo di aver campionato i pesi dei cani nel canile locale e di aver scoperto che il nostro campione ha una media di 20 libbre con una deviazione standard di 3 libbre. Con l'uso della disuguaglianza di Chebyshev, sappiamo che almeno il 75% dei cani che abbiamo campionato ha pesi che sono due deviazioni standard dalla media. Due volte la deviazione standard ci dà 2 x 3 = 6. Sottrai e aggiungi questo dalla media di 20. Questo ci dice che il 75% dei cani ha un peso da 14 a 26 libbre.
Se sappiamo di più sulla distribuzione con cui stiamo lavorando, di solito possiamo garantire che più dati sono un certo numero di deviazioni standard dalla media. Ad esempio, se sappiamo che abbiamo una distribuzione normale, il 95% dei dati è due deviazioni standard dalla media. La disuguaglianza di Chebyshev afferma che in questa situazione lo sappiamo almeno Il 75% dei dati è due deviazioni standard dalla media. Come possiamo vedere in questo caso, potrebbe essere molto più di questo 75%.
Il valore della disuguaglianza è che ci fornisce uno scenario di "caso peggiore" in cui le uniche cose che sappiamo sui nostri dati di esempio (o distribuzione di probabilità) sono la deviazione media e standard. Quando non sappiamo nient'altro sui nostri dati, la disuguaglianza di Chebyshev fornisce ulteriori spunti su quanto è estesa la serie di dati.
La disuguaglianza prende il nome dal matematico russo Pafnuty Chebyshev, che per primo dichiarò la disuguaglianza senza prove nel 1874. Dieci anni dopo la disuguaglianza fu dimostrata da Markov nel suo dottorato di ricerca. tesi di laurea. A causa delle variazioni nel modo di rappresentare l'alfabeto russo in inglese, è Chebyshev anche scritto come Tchebysheff.