Een van de doelen van statistieken is de organisatie en weergave van gegevens. Vaak is een manier om dit te doen het gebruik van een grafiek, grafiek of tabel. Wanneer u met gepaarde gegevens werkt, is een nuttig type grafiek een spreidingsdiagram. Met dit type grafiek kunnen we onze gegevens eenvoudig en effectief verkennen door een spreiding van punten in het vlak te onderzoeken.
Het is de moeite waard om te benadrukken dat een spreidingsdiagram een type grafiek is dat wordt gebruikt voor gepaarde gegevens. Dit is een type gegevensset waarbij aan elk van onze gegevenspunten twee nummers zijn gekoppeld. Veel voorkomende voorbeelden van dergelijke paren zijn:
Het lege canvas waarmee we voor onze spreidingsplot beginnen, is het Cartesiaanse coördinatensysteem. Dit wordt ook het rechthoekige coördinatensysteem genoemd omdat elk punt kan worden gelokaliseerd door een bepaalde rechthoek te tekenen. Een rechthoekig coördinatensysteem kan worden ingesteld door:
Nu kunnen we onze gegevenspunten plotten. Het eerste nummer in ons paar is de X-coördineren. Het is de horizontale afstand van de y-as, en dus ook de oorsprong. We gaan naar rechts voor positieve waarden van X en links van de oorsprong voor negatieve waarden van X.
Het tweede nummer in ons paar is de Y-coördineren. Het is de verticale afstand van de x-as. Beginnend op het oorspronkelijke punt op de X-as, ga omhoog voor positieve waarden van Y en omlaag voor negatieve waarden van Y.
De locatie op onze grafiek wordt vervolgens gemarkeerd met een stip. We herhalen dit proces steeds opnieuw voor elk punt in onze gegevensset. Het resultaat is een spreiding van punten, die de spreidingsplot zijn naam geeft.
Een belangrijke instructie die overblijft is om voorzichtig te zijn welke variabele op welke as staat. Als onze gepaarde gegevens bestaan uit een verklarend en antwoordpaar, wordt de verklarende variabele op de x-as aangegeven. Als beide variabelen als verklarend worden beschouwd, kunnen we kiezen welke op de x-as moet worden uitgezet en welke op de x Y-as.
Er zijn verschillende belangrijke kenmerken van een spreidingsdiagram. Door deze kenmerken te identificeren, kunnen we meer informatie over onze gegevensset achterhalen. Deze functies omvatten:
Scatterplots die een lineaire trend vertonen, kunnen worden geanalyseerd met de statistische technieken van lineaire regressie en correlatie. Regressie kan worden uitgevoerd voor andere soorten trends die niet-lineair zijn.