Esempio di test della bontà di adattamento Chi-quadrato

La bontà chi-quadro del test di adattamento è utile per confrontare un modello teorico con i dati osservati. Questo test è un tipo di test chi-quadro più generale. Come con qualsiasi argomento in matematica o statistica, può essere utile elaborare un esempio per capire cosa sta succedendo, attraverso un esempio della bontà chi-quadro del test di adattamento.

Considera un pacchetto standard di M & M al cioccolato al latte. Esistono sei colori diversi: rosso, arancione, giallo, verde, blu e marrone. Supponiamo che siamo curiosi della distribuzione di questi colori e chiediamo: tutti e sei i colori si presentano in proporzione uguale? Questo è il tipo di domanda a cui è possibile rispondere con un test di idoneità.

Ambientazione

Iniziamo annotando l'impostazione e perché la bontà del test di adattamento è appropriata. La nostra variabile di colore è categorica. Esistono sei livelli di questa variabile, corrispondenti ai sei colori possibili. Supponiamo che le M & M che contiamo saranno un semplice campione casuale dalla popolazione di tutte le M & M.

Ipotesi nulla e alternativa

Le ipotesi nulle e alternative per il nostro test di bontà di adattamento riflettono il presupposto che stiamo facendo sulla popolazione. Poiché stiamo verificando se i colori si presentano in proporzioni uguali, la nostra ipotesi nulla sarà che tutti i colori si presentino nella stessa proporzione. Più formalmente, se p1 è la percentuale di popolazione di caramelle rosse, p2 è la proporzione della popolazione di caramelle all'arancia e così via, quindi l'ipotesi nulla è quella p1 = p2 =… = p6 = 1/6.

L'ipotesi alternativa è che almeno una delle proporzioni della popolazione non è uguale a 1/6.

Conti effettivi e previsti

I conteggi effettivi sono il numero di caramelle per ciascuno dei sei colori. Il conteggio atteso si riferisce a ciò che ci aspetteremmo se l'ipotesi nulla fosse vera. Lo faremo n essere la dimensione del nostro campione. Il numero previsto di caramelle rosse è p1 n o n/ 6. In effetti, per questo esempio, il numero previsto di caramelle per ciascuno dei sei colori è semplicemente n volte pio, o n/ 6.

Statistica chi-quadro per la bontà di adattamento

Calcoleremo ora una statistica chi-quadro per un esempio specifico. Supponiamo di avere un semplice campione casuale di 600 caramelle M&M con la seguente distribuzione:

  • 212 delle caramelle sono blu.
  • 147 delle caramelle sono arancioni.
  • 103 delle caramelle sono verdi.
  • 50 delle caramelle sono rosse.
  • 46 delle caramelle sono gialle.
  • 42 delle caramelle sono marroni.

Se l'ipotesi nulla fosse vera, i conteggi attesi per ciascuno di questi colori sarebbero (1/6) x 600 = 100. Ora usiamo questo nel nostro calcolo della statistica chi-quadro.

Calcoliamo il contributo alla nostra statistica da ciascuno dei colori. Ognuno è nel formato (reale - previsto)2/Previsto.:

  • Per il blu abbiamo (212 - 100)2/ 100 = 125,44
  • Per l'arancia abbiamo (147-100)2/ 100 = 22.09
  • Per il verde abbiamo (103 - 100)2/ 100 = 0,09
  • Per il rosso abbiamo (50 - 100)2/ 100 = 25
  • Per il giallo abbiamo (46 - 100)2/ 100 = 29.16
  • Per il marrone abbiamo (42-100)2/ 100 = 33.64

Quindi sommiamo tutti questi contributi e determiniamo che la nostra statistica chi-quadro è 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.

Gradi di libertà

Il numero di gradi di libertà per un test di bontà di adattamento è semplicemente uno in meno rispetto al numero di livelli della nostra variabile. Dato che c'erano sei colori, abbiamo 6 - 1 = 5 gradi di libertà.

Tavolo Chi-quadrato e Valore P

La statistica chi-quadrato di 235.42 che abbiamo calcolato corrisponde a una posizione particolare su una distribuzione chi-quadrato con cinque gradi di libertà. Ora abbiamo bisogno di un valore p, per determinare la probabilità di ottenere una statistica test almeno estrema come 235,42, pur assumendo che l'ipotesi nulla sia vera.

Excel di Microsoft può essere utilizzato per questo calcolo. Scopriamo che la nostra statistica test con cinque gradi di libertà ha un valore p di 7,29 x 10-49. Questo è un valore p estremamente piccolo.

Regola Decisionale

Decidiamo se rifiutare l'ipotesi nulla in base alla dimensione del valore p. Poiché abbiamo un valore p molto minuscolo, respingiamo l'ipotesi nulla. Concludiamo che le M & M non sono distribuite uniformemente tra i sei diversi colori. Un'analisi di follow-up potrebbe essere utilizzata per determinare un intervallo di confidenza per la proporzione della popolazione di un particolare colore.