Gegevens kunnen op verschillende manieren worden weergegeven, waaronder grafieken, diagrammen en tabellen. Een stengel-en-bladplot is een type grafiek dat vergelijkbaar is met een histogram, maar meer informatie toont door de vorm van een set gegevens (de verdeling) samen te vatten en extra detail te bieden met betrekking tot individuele waarden. Deze gegevens worden gerangschikt op plaatswaarde waarbij de cijfers op de grootste plaats de stengel worden genoemd, terwijl de cijfers in de kleinste waarde of waarden het blad of de bladeren worden genoemd, die rechts van de stengel op de diagram.
Stamplanten zijn geweldige organisatoren voor grote hoeveelheden informatie. Het is echter ook handig om inzicht te hebben in het gemiddelde, de mediaan en de modus van gegevenssets in het algemeen, dus zorg ervoor dat u deze concepten doorneemt voordat u begint met het werken met stengel-en-bladplots.
Stam-en-blad plotgrafieken worden meestal gebruikt wanneer er grote hoeveelheden cijfers zijn om te analyseren. Enkele voorbeelden van veelvoorkomend gebruik van deze grafieken zijn het bijhouden van een reeks scores op sportteams, een reeks temperaturen of regenval gedurende een bepaalde periode of een reeks klassetestscores. Bekijk dit voorbeeld van testscores:
Testscores uit 100 | |
---|---|
Stam | Blad |
9 | 2 2 6 8 |
8 | 3 5 |
7 | 2 4 6 8 8 9 |
6 | 1 4 4 7 8 |
5 | 0 0 2 8 8 |
De stam toont de tientallen kolom en het blad. In één oogopslag ziet u dat vier studenten in de jaren 90 een 100 kregen op hun test van de 100. Twee studenten ontvingen hetzelfde cijfer van 92 en geen studenten ontvingen cijfers die onder de 50 vielen of 100 bereikten.
Wanneer u het totale aantal bladeren meet, weet u hoeveel studenten de test hebben afgelegd. Stam-en-bladplots bieden een overzichtstool voor specifieke informatie in grote hoeveelheden gegevens. Anders zou u een lange lijst met cijfers hebben om door te nemen en te analyseren.
U kunt deze vorm van gegevensanalyse gebruiken om mediaan te vinden, totalen te bepalen en de modi van gegevenssets te definiëren, waardoor waardevol inzicht wordt verkregen in trends en patronen in grote gegevenssets. In dit geval moet een docent ervoor zorgen dat de 16 studenten die lager dan 80 scoorden, de concepten op de test echt begrepen. Omdat 10 van die studenten niet slaagden voor de test, die goed is voor bijna de helft van de klas van 22 studenten, moet de leraar misschien een andere methode proberen die de falende groep studenten zou kunnen begrijpen.
Om twee gegevenssets te vergelijken, kunt u een rij-op-stam stengel-en-bladplot gebruiken. Als u bijvoorbeeld de scores van twee sportteams wilt vergelijken, kunt u de volgende plot gebruiken:
scores | ||
---|---|---|
Blad | Stam | Blad |
Tijgers | haaien | |
0 3 7 9 | 3 | 2 2 |
2 8 | 4 | 3 5 5 |
1 3 9 7 | 5 | 4 6 8 8 9 |
De tientallen kolom bevindt zich nu in de middelste kolom en die kolom bevindt zich rechts en links van de stengelkolom. Je kunt zien dat de haaien meer spellen hadden met een hogere score dan de tijgers omdat de haaien slechts twee spellen hadden met een score van 32, terwijl de tijgers vier spellen hadden - een 30, 33, 37 en een 39. Je kunt ook zien dat de haaien en de tijgers gelijk kwamen voor de hoogste score: een 59.
Sportfans gebruiken deze stengel- en bladgrafieken vaak om de scores van hun teams weer te geven om succes te vergelijken. Soms, wanneer het record voor overwinningen binnen een voetbalcompetitie gelijk is, wordt het hoger gerangschikte team bepaald door datasets te onderzoeken die beter waarneembaar zijn, inclusief de mediaan en het gemiddelde van de scores van de twee teams.
Probeer uw eigen stengel-en-blad plot met de volgende temperaturen voor juni. Bepaal vervolgens de mediaan voor de temperaturen:
77 80 82 68 65 59 61
57 50 62 61 70 69 64
67 70 62 65 65 73 76
87 80 82 83 79 79 71
80 77
Nadat u de gegevens op waarde hebt gesorteerd en gegroepeerd op het tientallencijfer, plaatst u ze in een grafiek met de naam "Temperaturen". Label de linkerkolom (de stengel) als "Tientallen" en de rechterkolom als "Degenen", vul vervolgens de overeenkomstige temperaturen in zoals ze hierboven voorkomen.
Nu je de kans hebt gehad om dit probleem zelf te proberen, lees dan verder om een voorbeeld te zien van de juiste manier om deze dataset op te maken als een stam-en-blad plotgrafiek.
temperaturen | |
---|---|
tientallen | Ones |
5 | 0 7 9 |
6 | 1 1 2 2 4 5 5 5 7 8 9 |
7 | 0 0 1 3 6 7 7 9 9 |
8 | 0 0 0 2 2 3 7 |
U moet altijd beginnen met het laagste nummer, of in dit geval temperatuur: 50. Aangezien 50 de laagste temperatuur van de maand was, voert u een 5 in de kolom tientallen en een 0 in die kolom in en observeert u de gegevensset voor de volgende laagste temperatuur: 57. Schrijf zoals eerder een 7 in de kolom Ones om aan te geven dat er één exemplaar van 57 is opgetreden, ga dan verder met de volgende laagste temperatuur van 59 en schrijf een 9 in de kolom Ones.
Vind alle temperaturen in de jaren 60, 70 en 80 en noteer de bijbehorende waarden voor elke temperatuur in de kolom Ones. Als je het correct hebt gedaan, zou het een plot-stengelgrafiek moeten opleveren die lijkt op die in deze sectie.
Om de mediaan te vinden, tel je alle dagen van de maand, in het geval van juni 30. Deel 30 door twee, wat 15 oplevert, tel op vanaf de laagste temperatuur van 50 of omlaag vanaf de hoogste temperatuur van 87 totdat je naar het 15e getal in de gegevensset, in dit geval 70. Dit is uw mediaanwaarde in de gegevensset.