Structurele vergelijkingsmodellering is een geavanceerde statistische techniek met veel lagen en veel complexe concepten. Onderzoekers die structurele vergelijkingsmodellering gebruiken, hebben een goed begrip van basisstatistieken, regressieanalyses en factoranalyses. Het bouwen van een structureel vergelijkingsmodel vereist een rigoureuze logica, evenals een grondige kennis van de veldtheorie en voorafgaand empirisch bewijs. Dit artikel biedt een zeer algemeen overzicht van structurele vergelijkingsmodellering zonder in te gaan op de ingewikkelde zaken.
Modellering van structurele vergelijkingen is een verzameling statistische technieken waarmee een reeks relaties tussen een of meer onafhankelijke variabelen en een of meer afhankelijke variabelen kan worden onderzocht. Zowel onafhankelijke als afhankelijke variabelen kunnen continu of discreet zijn en kunnen factoren of gemeten variabelen zijn. Modellering van structurele vergelijkingen heeft ook verschillende andere namen: causale modellering, causale analyse, gelijktijdige modellering van vergelijkingen, analyse van covariantiestructuren, padanalyse en analyse van bevestigende factoren.
Wanneer exploratieve factoranalyse wordt gecombineerd met meervoudige regressieanalyses, is het resultaat structurele vergelijkingsmodellering (SEM). Met SEM kunnen vragen worden beantwoord die betrekking hebben op meerdere regressieanalyses van factoren. Op het eenvoudigste niveau stelt de onderzoeker een verband tussen een enkele gemeten variabele en andere gemeten variabelen. Het doel van SEM is om 'ruwe' correlaties tussen direct waargenomen variabelen te verklaren.
Paddiagrammen
Paddiagrammen zijn van fundamenteel belang voor SEM omdat ze de onderzoeker in staat stellen het veronderstelde model of de reeks relaties in kaart te brengen. Deze diagrammen zijn nuttig bij het verduidelijken van de ideeën van de onderzoeker over de relaties tussen variabelen en kunnen direct worden vertaald in de vergelijkingen die nodig zijn voor analyse.
Paddiagrammen bestaan uit verschillende principes:
Gemeten variabelen worden weergegeven door vierkanten of rechthoeken.
Factoren, die uit twee of meer indicatoren bestaan, worden weergegeven door cirkels of ovalen.
Relaties tussen variabelen worden aangegeven door lijnen; het ontbreken van een lijn die de variabelen verbindt, impliceert dat er geen directe relatie wordt verondersteld.
Alle lijnen hebben een of twee pijlen. Een lijn met één pijl vertegenwoordigt een veronderstelde directe relatie tussen twee variabelen, en de variabele met de pijl er naar toe is de afhankelijke variabele. Een lijn met een pijl aan beide uiteinden geeft een niet-geanalyseerde relatie aan zonder impliciete effectrichting.
Onderzoeksvragen beantwoord door Structural Equation Modelling
De hoofdvraag van structurele vergelijkingsmodellen is: "Produceert het model een geschatte populatie-covariantiematrix die consistent is met de steekproef (waargenomen) covariantiematrix?" Hierna zijn er nog een aantal andere vragen die SEM kan beantwoorden.
Toereikendheid van het model: parameters worden geschat om een geschatte populatie-covariantiematrix te creëren. Als het model goed is, produceren de parameter-schattingen een geschatte matrix die dicht bij de steekproef van covariantiematrix ligt. Dit wordt voornamelijk geëvalueerd met de chi-kwadraat teststatistiek en fitte indices.
Testtheorie: elke theorie of elk model genereert zijn eigen covariantiematrix. Dus welke theorie is het beste? Modellen die concurrerende theorieën in een specifiek onderzoeksgebied vertegenwoordigen, worden geschat, tegenover elkaar geplaatst en geëvalueerd.
Hoeveelheid variantie in de variabelen die wordt verklaard door de factoren: Hoeveel van de variantie in de afhankelijke variabelen wordt verklaard door de onafhankelijke variabelen? Dit wordt beantwoord door statistieken van het R-kwadraattype.
Betrouwbaarheid van de indicatoren: hoe betrouwbaar zijn elk van de gemeten variabelen? SEM leidt betrouwbaarheid af van gemeten variabelen en betrouwbaarheid van interne consistentie.
Parameterschattingen: SEM genereert parameterschattingen of coëfficiënten voor elk pad in het model, die kunnen worden gebruikt om te onderscheiden of een pad meer of minder belangrijk is dan andere paden bij het voorspellen van de uitkomstmaat.
Bemiddeling: beïnvloedt een onafhankelijke variabele een specifieke afhankelijke variabele of beïnvloedt de onafhankelijke variabele de afhankelijke variabele via een bemiddelende variabele? Dit wordt een test van indirecte effecten genoemd.
Groepsverschillen: verschillen twee of meer groepen in hun covariantiematrices, regressiecoëfficiënten of middelen? Meerdere groepsmodellering kan in SEM worden gedaan om dit te testen.
Longitudinale verschillen: verschillen binnen en tussen mensen in de tijd kunnen ook worden onderzocht. Dit tijdsinterval kan jaren, dagen of zelfs microseconden zijn.
Modellering op meerdere niveaus: hier worden onafhankelijke variabelen verzameld op verschillende geneste meetniveaus (bijvoorbeeld studenten genest in klaslokalen genest binnen scholen) worden gebruikt om afhankelijke variabelen op dezelfde of andere meetniveaus te voorspellen.
Zwakke punten van structurele vergelijkingsmodellering
Ten opzichte van alternatieve statistische procedures heeft structurele vergelijkingsmodellering verschillende zwakke punten:
Het vereist een relatief grote steekproefgrootte (N van 150 of groter).
Het vereist veel meer formele training in statistiek om SEM-softwareprogramma's effectief te kunnen gebruiken.
Het vereist een goed gespecificeerde meting en een conceptueel model. SEM is theoriegedreven, dus moet men a priori modellen goed hebben ontwikkeld.
Referenties
Tabachnick, B. G. en Fidell, L. S. (2001). Met behulp van Multivariate Statistics, vierde editie. Needham Heights, MA: Allyn and Bacon.
Kercher, K. (bezocht november 2011). Inleiding tot SEM (Structural Equation Modelling). http://www.chrp.org/pdf/HSR061705.pdf