Bootstrapping is een krachtige statistische techniek. Het is vooral handig als de steekproefgrootte waarmee we werken klein is. Onder normale omstandigheden kunnen steekproefgroottes van minder dan 40 niet worden behandeld door een normale verdeling of een t-verdeling aan te nemen. Bootstrap-technieken werken redelijk goed met samples die minder dan 40 elementen bevatten. De reden hiervoor is dat bootstrapping opnieuw bemonsteren inhoudt. Dit soort technieken veronderstellen niets over de distributie van onze gegevens.
Bootstrapping is populairder geworden naarmate computerbronnen gemakkelijker beschikbaar zijn geworden. Dit komt omdat een praktische toepassing van bootstrapping een computer is. We zullen zien hoe dit werkt in het volgende voorbeeld van bootstrapping.
We beginnen met een statistische steekproef van een populatie waarvan we niets weten. Ons doel is een betrouwbaarheidsinterval van 90% over het gemiddelde van de steekproef. Hoewel andere statistische technieken die worden gebruikt om betrouwbaarheidsintervallen te bepalen aannemen dat we het gemiddelde of de standaarddeviatie van onze populatie kennen, vereist bootstrapping niets anders dan de steekproef.
In dit voorbeeld gaan we ervan uit dat de steekproef 1, 2, 4, 4, 10 is.
We resamplen nu met vervanging uit onze steekproef om zogenaamde bootstrap-monsters te vormen. Elke bootstrap-sample heeft een grootte van vijf, net als onze originele sample. Omdat we willekeurig selecteren en vervolgens elke waarde vervangen, kunnen de bootstrap-voorbeelden verschillen van het oorspronkelijke monster en van elkaar.
Voor voorbeelden die we in de echte wereld tegen zouden komen, zouden we dit honderden of zelfs duizenden keren resamplen. In wat hieronder volgt, zien we een voorbeeld van 20 bootstrap-voorbeelden:
Omdat we bootstrapping gebruiken om een betrouwbaarheidsinterval voor het populatiegemiddelde te berekenen, berekenen we nu de gemiddelden van elk van onze bootstrap-voorbeelden. Deze middelen, gerangschikt in oplopende volgorde zijn: 2, 2.4, 2.6, 2.6, 2.8, 3, 3, 3.2, 3.4, 3.6, 3.8, 4, 4, 4.2, 4.6, 5.2, 6, 6, 6.6, 7.6.
We halen nu uit onze lijst met bootstrap-voorbeelden een betrouwbaarheidsinterval. Omdat we een betrouwbaarheidsinterval van 90% willen, gebruiken we de 95e en 5e percentielen als eindpunten van de intervallen. De reden hiervoor is dat we 100% - 90% = 10% in twee delen, zodat we de middelste 90% van alle bootstrap-voorbeeldmiddelen hebben.
Voor ons voorbeeld hierboven hebben we een betrouwbaarheidsinterval van 2,4 tot 6,6.