Uno degli obiettivi della statistica è organizzare i dati in modo significativo. Le tabelle a due vie sono un modo importante per organizzare un particolare tipo di dati associati. Come per la costruzione di grafici o tabelle nelle statistiche, è molto importante conoscere i tipi di variabili con cui stiamo lavorando. Se disponiamo di dati quantitativi, è necessario utilizzare un grafico come un istogramma o un diagramma di gambo e foglia. Se disponiamo di dati categorici, è appropriato un grafico a barre o un grafico a torta.
Quando si lavora con i dati associati, dobbiamo stare attenti. Esiste un diagramma a dispersione per i dati quantitativi associati, ma che tipo di grafico esiste per i dati categoriali associati? Ogni volta che abbiamo due variabili categoriali, allora dovremmo usare una tabella a due vie.
Innanzitutto, ricordiamo che i dati categorici si riferiscono a tratti o categorie. Non è quantitativo e non ha valori numerici.
Una tabella a due vie prevede l'elenco di tutti i valori o livelli per due variabili categoriali. Tutti i valori per una delle variabili sono elencati in una colonna verticale. I valori per l'altra variabile sono elencati lungo una riga orizzontale. Se la prima variabile ha m valori e la seconda variabile ha n valori, quindi ci sarà un totale di mn voci nella tabella. Ognuna di queste voci corrisponde a un valore particolare per ciascuna delle due variabili.
Lungo ogni riga e lungo ogni colonna, le voci vengono sommate. Questi totali sono importanti per determinare le distribuzioni marginali e condizionali. Questi totali sono importanti anche quando eseguiamo un test chi-quadro per l'indipendenza.
Ad esempio, considereremo una situazione in cui esamineremo diverse sezioni di un corso di statistica presso un'università. Vogliamo costruire una tabella a due vie per determinare quali differenze ci sono tra maschi e femmine nel corso. Per raggiungere questo obiettivo, contiamo il numero di ciascun voto di lettere che è stato guadagnato dai membri di ciascun genere.
Notiamo che la prima variabile categorica è quella del genere e ci sono due possibili valori nello studio di maschio e femmina. La seconda variabile categoriale è quella del voto in lettere, e ci sono cinque valori che sono dati da A, B, C, D e F. Ciò significa che avremo una tabella a due vie con 2 x 5 = 10 voci, più un riga aggiuntiva e una colonna aggiuntiva che saranno necessarie per tabulare i totali di riga e colonna.
La nostra indagine mostra che:
Questa informazione è inserita nella tabella a due vie di seguito. Il totale di ogni riga ci dice quanti di ogni tipo di voto sono stati guadagnati. I totali delle colonne indicano il numero di maschi e il numero di femmine.
Le tabelle a due vie aiutano a organizzare i nostri dati quando abbiamo due variabili categoriali. Questa tabella può essere utilizzata per aiutarci a confrontare tra due diversi gruppi nei nostri dati. Ad esempio, potremmo considerare le prestazioni relative dei maschi nel corso delle statistiche rispetto alle prestazioni delle femmine nel corso.
Dopo aver formato una tabella a due vie, il passaggio successivo potrebbe essere quello di analizzare statisticamente i dati. Potremmo chiederci se le variabili che sono nello studio sono indipendenti l'una dall'altra o no. Per rispondere a questa domanda possiamo usare un test chi-quadro sulla tabella a due vie.
Maschio | Femmina | Totale | |
UN | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Totale | 280 | 260 | 540 |