Parametrische en niet-parametrische methoden in de statistiek

Er zijn een paar onderverdelingen van onderwerpen in statistieken. Een divisie die snel te binnen schiet is het onderscheid tussen beschrijvende en inferentiële statistieken. Er zijn andere manieren waarop we het vak statistiek kunnen onderscheiden. Een van deze manieren is om statistische methoden te classificeren als parametrisch of niet-parametrisch.

We zullen ontdekken wat het verschil is tussen parametrische methoden en niet-parametrische methoden. De manier waarop we dit doen, is door verschillende instanties van dit soort methoden te vergelijken.

Parametrische methoden

Methoden worden geclassificeerd door wat we weten over de populatie die we bestuderen. Parametrische methoden zijn meestal de eerste methoden die worden bestudeerd in een inleidende cursus statistiek. Het basisidee is dat er een set vaste parameters is die een waarschijnlijkheidsmodel bepalen.

Parametrische methoden zijn vaak die waarvan we weten dat de populatie ongeveer normaal is, of we kunnen benaderen met behulp van een normale verdeling nadat we de centrale limietstelling hebben ingeroepen. Er zijn twee parameters voor een normale verdeling: het gemiddelde en de standaardafwijking.

Uiteindelijk hangt de classificatie van een methode als parametrisch af van de aannames die over een populatie worden gedaan. Enkele parametrische methoden zijn:

  • Betrouwbaarheidsinterval voor een populatiegemiddelde, met bekende standaardafwijking.
  • Betrouwbaarheidsinterval voor een populatiegemiddelde, met onbekende standaarddeviatie.
  • Vertrouwensinterval voor een populatievariantie.
  • Vertrouwensinterval voor het verschil van twee gemiddelden, met onbekende standaarddeviatie.

Niet-parametrische methoden

In tegenstelling tot parametrische methoden zullen we niet-parametrische methoden definiëren. Dit zijn statistische technieken waarvoor we geen parameters hoeven aan te nemen voor de populatie die we bestuderen. De methoden zijn inderdaad niet afhankelijk van de betreffende populatie. De set parameters is niet langer vast en de distributie die we gebruiken ook niet. Het is om deze reden dat niet-parametrische methoden ook distributievrije methoden worden genoemd.

Niet-parametrische methoden worden om een ​​aantal redenen steeds populairder en beïnvloeden. De belangrijkste reden is dat we niet zoveel worden beperkt als wanneer we een parametrische methode gebruiken. We hoeven niet zoveel veronderstellingen over de populatie te maken waarmee we werken als wat we moeten doen met een parametrische methode. Veel van deze niet-parametrische methoden zijn eenvoudig toe te passen en te begrijpen.

Enkele niet-parametrische methoden zijn:

  • Tekentest voor populatiegemiddelde
  • Bootstrapping technieken
  • U test voor twee onafhankelijke middelen
  • Spearman correlatietest

Vergelijking

Er zijn meerdere manieren om statistieken te gebruiken om een ​​betrouwbaarheidsinterval voor een gemiddelde te vinden. Een parametrische methode omvat de berekening van een foutenmarge met een formule en de schatting van het populatiegemiddelde met een steekproefgemiddelde. Een niet-parametrische methode om een ​​betrouwbaarheidsgemiddelde te berekenen zou het gebruik van bootstrapping inhouden.

Waarom hebben we voor dit soort problemen zowel parametrische als niet-parametrische methoden nodig? Vaak zijn parametrische methoden efficiënter dan de bijbehorende niet-parametrische methoden. Hoewel dit verschil in efficiëntie meestal niet zo'n probleem is, zijn er gevallen waarin we moeten overwegen welke methode efficiënter is.