De betekenis van betrouwbaarheid in de sociologie

Betrouwbaarheid is de mate waarin een meetinstrument elke keer dat het wordt gebruikt dezelfde resultaten geeft, ervan uitgaande dat het onderliggende ding dat wordt gemeten niet verandert.

Belangrijkste afhaalrestaurants: betrouwbaarheid

Als een meetinstrument telkens wanneer het wordt gebruikt vergelijkbare resultaten oplevert (ervan uitgaande dat alles wat wordt gemeten in de loop van de tijd hetzelfde blijft), wordt gezegd dat het een hoge betrouwbaarheid heeft.
Goede meetinstrumenten moeten zowel een hoge betrouwbaarheid als een hoge nauwkeurigheid hebben.
Vier methoden die sociologen kunnen gebruiken om de betrouwbaarheid te beoordelen, zijn de test-hertestprocedure, de procedure voor alternatieve vormen, de split-helften-procedure en de interne consistentieprocedure.

Een voorbeeld

Stel je voor dat je de betrouwbaarheid van een thermometer in je huis probeert te beoordelen. Als de temperatuur in een kamer hetzelfde blijft, geeft een betrouwbare thermometer altijd dezelfde waarde. Een thermometer die betrouwbaarheid mist, zou zelfs veranderen als de temperatuur dat niet doet. Merk echter op dat de thermometer niet nauwkeurig hoeft te zijn om betrouwbaar te zijn. Het kan bijvoorbeeld altijd drie graden te hoog zijn. De mate van betrouwbaarheid heeft in plaats daarvan te maken met de voorspelbaarheid van de relatie met wat er wordt getest.

Methoden om de betrouwbaarheid te beoordelen

Om de betrouwbaarheid te beoordelen, moet het te meten ding meer dan eens worden gemeten. Als u bijvoorbeeld de lengte van een bank wilt meten om te zorgen dat deze door een deur past, kunt u deze twee keer meten. Als u twee keer een identieke meting krijgt, kunt u erop vertrouwen dat u betrouwbaar meet.

Er zijn vier procedures voor het beoordelen van de betrouwbaarheid van een test. (Hier verwijst de term "test" naar een groep uitspraken over een vragenlijst, de kwantitatieve of kwalitatieve evaluatie van een waarnemer, of een combinatie van beide.)

De test-hertest procedure

Hier wordt dezelfde test twee of meer keer gegeven. U kunt bijvoorbeeld een vragenlijst maken met een set van tien verklaringen om het vertrouwen te beoordelen. Deze tien uitspraken worden vervolgens tweemaal op twee verschillende tijdstippen aan een onderwerp gegeven. Als de respondent beide keren vergelijkbare antwoorden geeft, kunt u ervan uitgaan dat de vragen de antwoorden van de proefpersoon betrouwbaar hebben beoordeeld.

Een voordeel van deze methode is dat voor deze procedure slechts één test hoeft te worden ontwikkeld. Er zijn echter enkele nadelen van de test-hertestprocedure. Tussen de testtijden kunnen gebeurtenissen plaatsvinden die de antwoorden van de respondenten beïnvloeden; antwoorden kunnen in de loop van de tijd veranderen, simpelweg omdat mensen veranderen en in de loop van de tijd groeien; en het onderwerp kan zich de tweede keer aanpassen aan de test, dieper nadenken over de vragen en hun antwoorden opnieuw evalueren. In het bovenstaande voorbeeld kunnen sommige respondenten tussen de eerste en tweede testsessie meer zelfvertrouwen hebben gekregen, waardoor het moeilijker zou zijn om de resultaten van de test-hertestprocedure te interpreteren.

De alternatieve formulierenprocedure

In de alternatieve formulierenprocedure (ook wel parallelle formulierenbetrouwbaarheid genoemd) worden twee tests gegeven. U kunt bijvoorbeeld twee sets van vijf uitspraken maken die het vertrouwen meten. De proefpersonen zouden worden gevraagd om elk van de vragenlijsten met vijf verklaringen in te vullen. Als de persoon voor beide tests vergelijkbare antwoorden geeft, kunt u ervan uitgaan dat u het concept betrouwbaar hebt gemeten. Een voordeel is dat cueing minder van belang zal zijn omdat de twee tests verschillend zijn. Het is echter belangrijk om ervoor te zorgen dat beide alternatieve versies van de test inderdaad hetzelfde meten.

De split-helftenprocedure

In deze procedure wordt één enkele test gegeven. Aan elke helft wordt een cijfer afzonderlijk toegekend en uit elke helft worden cijfers vergeleken. U hebt bijvoorbeeld één set van tien verklaringen op een vragenlijst om het vertrouwen te beoordelen. Respondenten doen de test en de vragen worden vervolgens opgesplitst in twee subtests van elk vijf items. Als de score op de eerste helft de score op de tweede helft weerspiegelt, kunt u ervan uitgaan dat de test het concept betrouwbaar heeft gemeten. Aan de positieve kant, geschiedenis, rijping en cueing spelen niet. De scores kunnen echter sterk variëren, afhankelijk van de manier waarop de test in helften is verdeeld.

De interne consistentieprocedure

Hier wordt dezelfde test eenmaal afgenomen en is de score gebaseerd op gemiddelde gelijkenis van responsen. In een vragenlijst met tien verklaringen om het vertrouwen te meten, kan elke respons bijvoorbeeld worden gezien als een subtest met één verklaring. De gelijkenis in antwoorden op elk van de tien verklaringen wordt gebruikt om de betrouwbaarheid te beoordelen. Als de respondent niet alle tien stellingen op dezelfde manier beantwoordt, kan worden aangenomen dat de test niet betrouwbaar is. Een manier waarop onderzoekers interne consistentie kunnen beoordelen, is door statistische software te gebruiken om de alfa van Cronbach te berekenen.

Met de interne consistentieprocedure zijn geschiedenis, rijping en cueing geen overweging. Het aantal uitspraken in de test kan echter van invloed zijn op de beoordeling van de betrouwbaarheid wanneer deze intern wordt beoordeeld.

Wetenschap