I dati del panel, noti anche come dati longitudinali o in serie temporali in alcuni casi speciali, sono dati derivati da un numero (generalmente piccolo) di osservazioni nel tempo su un numero (solitamente elevato) di unità trasversali come individui , famiglie, aziende o governi.
Nelle discipline di econometria e statistica, i dati del panel si riferiscono a dati multidimensionali che generalmente comportano misurazioni per un certo periodo di tempo. Pertanto, i dati del panel consistono nelle osservazioni dei ricercatori su numerosi fenomeni che sono stati raccolti in diversi periodi di tempo per lo stesso gruppo di unità o entità. Ad esempio, un set di dati del panel può essere quello che segue nel tempo un determinato campione di individui e registra osservazioni o informazioni su ciascun individuo nel campione.
I seguenti sono esempi di base di due set di dati di panel per 2-3 persone nel corso di diversi anni in cui i dati raccolti o osservati includono reddito, età e sesso:
Set di dati del pannello A
Persona | Anno | Reddito | Età | Sesso |
1 | 2013 | 20.000 | 23 | F |
1 | 2014 | 25.000 | 24 | F |
1 | 2015 | 27.500 | 25 | F |
2 | 2013 | 35.000 | 27 | M |
2 | 2014 | 42.500 | 28 | M |
2 | 2015 | 50.000 | 29 | M |
Set di dati del pannello B
Persona | Anno | Reddito | Età | Sesso |
1 | 2013 | 20.000 | 23 | F |
1 | 2014 | 25.000 | 24 | F |
2 | 2013 | 35.000 | 27 | M |
2 | 2014 | 42.500 | 28 | M |
2 | 2015 | 50.000 | 29 | M |
3 | 2014 | 46.000 | 25 | F |
Sia il set di dati del pannello A che il set di dati del pannello B sopra mostrano i dati raccolti (le caratteristiche di reddito, età e sesso) nel corso di diversi anni per persone diverse. Il set di dati del panel A mostra i dati raccolti per due persone (persona 1 e persona 2) nel corso di tre anni (2013, 2014 e 2015). Questo set di dati di esempio verrebbe considerato a pannello bilanciato perché ogni persona è osservata per le caratteristiche definite di reddito, età e sesso ogni anno dello studio. Il set di dati del pannello B, d'altra parte, sarebbe considerato un pannello sbilanciato poiché i dati non esistono per ogni persona ogni anno. Le caratteristiche della persona 1 e della persona 2 sono state raccolte nel 2013 e 2014, ma la persona 3 è stata osservata solo nel 2014, non nel 2013 e 2014.
Esistono due insiemi distinti di informazioni che possono essere derivate da dati di serie temporali trasversali. La componente della sezione trasversale del set di dati riflette le differenze osservate tra i singoli soggetti o entità, mentre la componente delle serie temporali che riflette le differenze osservate per un soggetto nel tempo. Ad esempio, i ricercatori potrebbero concentrarsi sulle differenze nei dati tra ciascuna persona in uno studio del panel e / o sui cambiamenti nei fenomeni osservati per una persona nel corso dello studio (ad esempio, le variazioni del reddito nel tempo della persona 1 nei dati del panel Imposta A sopra).
Sono i metodi di regressione dei dati dei panel che consentono agli economisti di utilizzare queste varie serie di informazioni fornite dai dati dei panel. Pertanto, l'analisi dei dati del panel può diventare estremamente complessa. Ma questa flessibilità è precisamente il vantaggio dei set di dati del panel per la ricerca economica rispetto ai dati trasversali o di serie temporali convenzionali. I dati del panel offrono ai ricercatori un gran numero di punti dati unici, il che aumenta il grado di libertà del ricercatore di esplorare variabili e relazioni esplicative.