Dati associati nelle statistiche

I dati accoppiati nelle statistiche, spesso indicati come coppie ordinate, si riferiscono a due variabili negli individui di una popolazione che sono collegate tra loro per determinare la correlazione tra di loro. Affinché un set di dati sia considerato come dati accoppiati, entrambi questi valori di dati devono essere collegati o collegati tra loro e non considerati separatamente.

L'idea di dati accoppiati è in contrasto con la consueta associazione di un numero a ciascun punto dati come in altri insiemi di dati quantitativi in ​​quanto ogni singolo punto dati è associato a due numeri, fornendo un grafico che consente agli statistici di osservare la relazione tra queste variabili in una popolazione.

Questo metodo di dati accoppiati viene utilizzato quando uno studio spera di confrontare due variabili negli individui della popolazione per trarre una sorta di conclusione sulla correlazione osservata. Quando si osservano questi punti di dati, l'ordine dell'associazione è importante perché il primo numero è una misura di una cosa mentre il secondo è una misura di qualcosa di completamente diverso.

Esempio di dati associati

Per vedere un esempio di dati accoppiati, supponiamo che un insegnante conti il ​​numero di compiti assegnati a ciascuno studente per una determinata unità e quindi abbina questo numero alla percentuale di ogni studente sul test unitario. Le coppie sono le seguenti:

  • Una persona che ha completato 10 incarichi ha guadagnato il 95% con il suo test. (10, 95%)
  • Una persona che ha completato 5 incarichi ha guadagnato l'80% con il suo test. (5, 80%)
  • Una persona che ha completato 9 incarichi ha guadagnato l'85% con il suo test. (9, 85%)
  • Una persona che ha completato 2 incarichi ha guadagnato il 50% sul suo test. (2, 50%)
  • Una persona che ha completato 5 incarichi ha guadagnato il 60% con il suo test. (5, 60%)
  • Una persona che ha completato 3 incarichi ha guadagnato il 70% con il suo test. (3, 70%)

In ciascuna di queste serie di dati accoppiati, possiamo vedere che il numero di assegnazioni viene sempre per primo nella coppia ordinata mentre la percentuale guadagnata sul test è seconda, come si è visto nella prima istanza di (10, 95%).

Mentre un'analisi statistica di questi dati potrebbe anche essere utilizzata per calcolare il numero medio di compiti completati o il punteggio medio del test, ci possono essere altre domande da porre sui dati. In questo caso, l'insegnante desidera sapere se esiste una connessione tra il numero di compiti assegnati e l'esecuzione del test e l'insegnante dovrebbe tenere i dati accoppiati per rispondere a questa domanda.

Analisi dei dati associati

Le tecniche statistiche di correlazione e regressione sono utilizzate per analizzare i dati accoppiati in cui il coefficiente di correlazione quantifica quanto i dati si trovano lungo una linea retta e misura la forza della relazione lineare.

La regressione, d'altra parte, viene utilizzata per diverse applicazioni, inclusa la determinazione della linea più adatta al nostro set di dati. A sua volta, questa linea può essere utilizzata per stimare o prevedere y valori per valori di X che non facevano parte del nostro set di dati originale.

Esiste un tipo speciale di grafico particolarmente adatto per i dati associati chiamato scatterplot. In questo tipo di grafico, un asse di coordinate rappresenta una quantità di dati associati mentre l'altro asse di coordinate rappresenta l'altra quantità di dati associati.

Un diagramma a dispersione per i dati di cui sopra dovrebbe indicare all'asse x il numero di incarichi consegnati mentre l'asse y indica i punteggi nel test unitario.