Wat is een spreidingsdiagram?

Een van de doelen van statistieken is de organisatie en weergave van gegevens. Vaak is een manier om dit te doen het gebruik van een grafiek, grafiek of tabel. Wanneer u met gepaarde gegevens werkt, is een nuttig type grafiek een spreidingsdiagram. Met dit type grafiek kunnen we onze gegevens eenvoudig en effectief verkennen door een spreiding van punten in het vlak te onderzoeken.

Gekoppelde gegevens

Het is de moeite waard om te benadrukken dat een spreidingsdiagram een ​​type grafiek is dat wordt gebruikt voor gepaarde gegevens. Dit is een type gegevensset waarbij aan elk van onze gegevenspunten twee nummers zijn gekoppeld. Veel voorkomende voorbeelden van dergelijke paren zijn:

  • Een meting voor en na een behandeling. Dit kan de vorm aannemen van het optreden van een student tijdens een pretest en later een posttest.
  • Een passend experimenteel parenontwerp. Hier bevindt een individu zich in de controlegroep en een ander soortgelijk individu bevindt zich in de behandelingsgroep.
  • Twee metingen van dezelfde persoon. We kunnen bijvoorbeeld het gewicht en de lengte van 100 personen registreren.

2D grafieken

Het lege canvas waarmee we voor onze spreidingsplot beginnen, is het Cartesiaanse coördinatensysteem. Dit wordt ook het rechthoekige coördinatensysteem genoemd omdat elk punt kan worden gelokaliseerd door een bepaalde rechthoek te tekenen. Een rechthoekig coördinatensysteem kan worden ingesteld door:

  1. Beginnend met een horizontale getallenlijn. Dit wordt het genoemd X-as.
  2. Voeg een verticale getallenlijn toe. Snijd de X-as zodanig dat het nulpunt van beide lijnen elkaar kruist. Deze tweede getallenlijn wordt de genoemd Y-as.
  3. Het punt waar de nullen van onze getallenlijn elkaar kruisen, wordt de oorsprong genoemd.

Nu kunnen we onze gegevenspunten plotten. Het eerste nummer in ons paar is de X-coördineren. Het is de horizontale afstand van de y-as, en dus ook de oorsprong. We gaan naar rechts voor positieve waarden van X en links van de oorsprong voor negatieve waarden van X.

Het tweede nummer in ons paar is de Y-coördineren. Het is de verticale afstand van de x-as. Beginnend op het oorspronkelijke punt op de X-as, ga omhoog voor positieve waarden van Y en omlaag voor negatieve waarden van Y.

De locatie op onze grafiek wordt vervolgens gemarkeerd met een stip. We herhalen dit proces steeds opnieuw voor elk punt in onze gegevensset. Het resultaat is een spreiding van punten, die de spreidingsplot zijn naam geeft.

Toelichting en reactie

Een belangrijke instructie die overblijft is om voorzichtig te zijn welke variabele op welke as staat. Als onze gepaarde gegevens bestaan ​​uit een verklarend en antwoordpaar, wordt de verklarende variabele op de x-as aangegeven. Als beide variabelen als verklarend worden beschouwd, kunnen we kiezen welke op de x-as moet worden uitgezet en welke op de x Y-as.

Kenmerken van een Scatterplot

Er zijn verschillende belangrijke kenmerken van een spreidingsdiagram. Door deze kenmerken te identificeren, kunnen we meer informatie over onze gegevensset achterhalen. Deze functies omvatten:

  • De algemene trend onder onze variabelen. Zoals we van links naar rechts lezen, wat is het grote plaatje? Een opwaarts patroon, neerwaarts of cyclisch?
  • Eventuele uitbijters uit de algemene trend. Zijn dit uitschieters uit de rest van onze gegevens, of zijn ze invloedrijke punten?
  • De vorm van elke trend. Is dit lineair, exponentieel, logaritmisch of iets anders?
  • De kracht van elke trend. Hoe nauw passen de gegevens in het algemene patroon dat we hebben geïdentificeerd?

Gerelateerde onderwerpen

Scatterplots die een lineaire trend vertonen, kunnen worden geanalyseerd met de statistische technieken van lineaire regressie en correlatie. Regressie kan worden uitgevoerd voor andere soorten trends die niet-lineair zijn.