Wat zijn paneelgegevens?

Paneldata, ook wel longitudinale data of cross-sectionele tijdreeksgegevens genoemd in sommige speciale gevallen, zijn data die is afgeleid van een (meestal klein) aantal observaties in de tijd op een (meestal groot) aantal transversale eenheden zoals individuen , huishoudens, bedrijven of overheden.

In de disciplines econometrie en statistiek verwijzen paneelgegevens naar multidimensionale gegevens die doorgaans gedurende een bepaalde periode worden gemeten. Als zodanig bestaan ​​paneldata uit observaties van onderzoekers van talrijke fenomenen die gedurende verschillende tijdsperioden voor dezelfde groep eenheden of entiteiten werden verzameld. Een gegevensset van een paneel kan er bijvoorbeeld een zijn die een bepaald monster van individuen in de loop van de tijd volgt en waarnemingen of informatie over elk individu in het monster registreert.

Basisvoorbeelden van paneelgegevenssets

Hierna volgen zeer eenvoudige voorbeelden van twee panelgegevenssets voor twee tot drie personen in de loop van meerdere jaren waarin de verzamelde of waargenomen gegevens inkomen, leeftijd en geslacht omvatten:

Paneelgegevensset A

Persoon

Jaar Inkomen Leeftijd Seks
1 2013 20.000 23 F
1 2014 25.000 24 F
1 2015 27.500 25 F
2 2013 35.000 27 M
2 2014 42.500 28 M
2 2015 50.000 29 M

Paneelgegevensset B

Persoon

Jaar Inkomen Leeftijd Seks
1 2013 20.000 23 F
1 2014 25.000 24 F
2 2013 35.000 27 M
2 2014 42.500 28 M
2 2015 50.000 29 M
3 2014 46.000 25 F

Zowel de Paneelgegevensset A als de Paneelgegevensset B hierboven tonen de verzamelde gegevens (de kenmerken van inkomen, leeftijd en geslacht) in de loop van meerdere jaren voor verschillende mensen. Paneelgegevensset A toont de gegevens die zijn verzameld voor twee personen (persoon 1 en persoon 2) gedurende drie jaar (2013, 2014 en 2015). Deze voorbeeldgegevensset wordt beschouwd als een uitgebalanceerd paneel omdat elke persoon wordt geobserveerd voor de gedefinieerde kenmerken van inkomen, leeftijd en geslacht elk jaar van de studie. Paneelgegevensverzameling B daarentegen zou als een worden beschouwd onevenwichtig paneel omdat er niet elk jaar gegevens voor elke persoon beschikbaar zijn. Kenmerken van persoon 1 en persoon 2 werden verzameld in 2013 en 2014, maar persoon 3 wordt alleen waargenomen in 2014, niet 2013 en 2014. 

Analyse van panelgegevens in economisch onderzoek

Er zijn twee verschillende sets informatie die kunnen worden afgeleid uit tijdreeksgegevens in dwarsdoorsnede. De dwarsdoorsnedecomponent van de gegevensverzameling weerspiegelt de waargenomen verschillen tussen de individuele subjecten of entiteiten, terwijl de tijdreekscomponent de verschillen weerspiegelt die in de loop van de tijd voor één subject zijn waargenomen. Onderzoekers zouden zich bijvoorbeeld kunnen concentreren op de verschillen in gegevens tussen elke persoon in een panelonderzoek en / of de veranderingen in waargenomen fenomenen voor één persoon in de loop van het onderzoek (bijvoorbeeld de inkomensveranderingen in de tijd van persoon 1 in Panel Data Set A hierboven).

Het zijn paneldataregressiemethoden waarmee economen deze verschillende sets informatie kunnen gebruiken die door paneldata worden verstrekt. Als zodanig kan analyse van paneelgegevens extreem complex worden. Maar deze flexibiliteit is precies het voordeel van paneeldatasets voor economisch onderzoek in tegenstelling tot conventionele transversale of tijdreeksgegevens. Paneldata geeft onderzoekers een groot aantal unieke datapunten, waardoor de mate van vrijheid van de onderzoeker om verklarende variabelen en relaties te verkennen toeneemt.