Wat is de F-verdeling?

Er zijn veel kansverdelingen die in de hele statistiek worden gebruikt. De standaard normale verdeling of belcurve is bijvoorbeeld waarschijnlijk de meest algemeen erkende. Normale distributies zijn slechts één type distributie. Een zeer nuttige kansverdeling voor het bestuderen van populatievarianties wordt de F-verdeling genoemd. We zullen verschillende eigenschappen van dit type distributie onderzoeken.

Basiseigenschappen

De kansdichtheidsformule voor de F-verdeling is vrij ingewikkeld. In de praktijk hoeven we ons geen zorgen te maken over deze formule. Het kan echter heel nuttig zijn om enkele details van de eigenschappen met betrekking tot de F-verdeling te kennen. Enkele van de belangrijkste kenmerken van deze distributie staan ​​hieronder:

  • De F-distributie is een familie van distributies. Dit betekent dat er een oneindig aantal verschillende F-distributies is. De specifieke F-distributie die we voor een toepassing gebruiken, is afhankelijk van het aantal vrijheidsgraden dat onze steekproef heeft. Dit kenmerk van de F-distributie is vergelijkbaar met beide t-distributie en de chikwadraatverdeling.
  • De F-verdeling is nul of positief, dus er zijn geen negatieve waarden voor F. Dit kenmerk van de F-verdeling is vergelijkbaar met de chikwadraatverdeling.
  • De F-verdeling staat scheef naar rechts. Deze kansverdeling is dus niet-symmetrisch. Dit kenmerk van de F-verdeling is vergelijkbaar met de chikwadraatverdeling.

Dit zijn enkele van de belangrijkste en gemakkelijk te identificeren functies. We zullen de vrijheidsgraden nader bekijken.

Graden van vrijheid

Een kenmerk dat wordt gedeeld door chi-square distributies, t-distributies en F-distributies is dat er echt een oneindige familie is van elk van deze distributies. Een bepaalde verdeling wordt onderscheiden door het aantal vrijheidsgraden te kennen. Voor een t distributie, het aantal vrijheidsgraden is één minder dan onze steekproefomvang. Het aantal vrijheidsgraden voor een F-verdeling wordt op een andere manier bepaald dan voor een t-verdeling of zelfs chikwadraatverdeling.

We zullen hieronder precies zien hoe een F-verdeling ontstaat. Voor nu zullen we alleen genoeg overwegen om het aantal vrijheidsgraden te bepalen. De F-verdeling is afgeleid van een verhouding waarbij twee populaties betrokken zijn. Er is een monster van elk van deze populaties en dus zijn er vrijheidsgraden voor beide monsters. In feite trekken we er één af van beide steekproefgroottes om onze twee aantallen vrijheidsgraden te bepalen.

Statistieken van deze populaties combineren in een fractie voor de F-statistiek. Zowel de teller als de noemer hebben vrijheidsgraden. In plaats van deze twee getallen in een ander getal te combineren, behouden we ze allebei. Daarom vereist elk gebruik van een F-distributietabel dat we twee verschillende vrijheidsgraden opzoeken.

Gebruik van de F-distributie

De F-verdeling komt voort uit inferentiële statistieken betreffende populatievarianties. Meer specifiek gebruiken we een F-verdeling wanneer we de verhouding van de varianties van twee normaal verdeelde populaties bestuderen.

De F-verdeling wordt niet alleen gebruikt om betrouwbaarheidsintervallen te construeren en hypothesen over populatievarianties te testen. Dit type verdeling wordt ook gebruikt in een one-factor variantieanalyse (ANOVA). ANOVA houdt zich bezig met het vergelijken van de variatie tussen verschillende groepen en variatie binnen elke groep. Om dit te bereiken gebruiken we een verhouding van varianties. Deze variatieverhouding heeft de F-verdeling. Een enigszins gecompliceerde formule stelt ons in staat om een ​​F-statistiek te berekenen als een teststatistiek.