Vrijheidsgraden in statistiek en wiskunde

In statistieken worden de vrijheidsgraden gebruikt om het aantal onafhankelijke hoeveelheden te definiëren dat aan een statistische verdeling kan worden toegewezen. Dit getal verwijst meestal naar een positief geheel getal dat aangeeft dat er geen beperkingen zijn voor het vermogen van een persoon om ontbrekende factoren uit statistische problemen te berekenen.

Vrijheidsgraden fungeren als variabelen in de uiteindelijke berekening van een statistiek en worden gebruikt om de uitkomst van verschillende scenario's in een systeem te bepalen, en bepalen in wiskundige vrijheidsgraden het aantal dimensies in een domein dat nodig is om de volledige vector te bepalen.

Om het concept van een mate van vrijheid te illustreren, zullen we kijken naar een basisberekening met betrekking tot het steekproefgemiddelde, en om het gemiddelde van een lijst met gegevens te vinden, voegen we alle gegevens toe en delen door het totale aantal waarden.

Een illustratie met een voorbeeldgemiddelde

Stel dat we weten dat het gemiddelde van een gegevensset 25 is en dat de waarden in deze set 20, 10, 50 en een onbekend getal zijn. De formule voor een steekproefgemiddelde geeft ons de vergelijking (20 + 10 + 50 + x) / 4 = 25, waar X geeft het onbekende aan, met behulp van een basisalgebra, kan men vervolgens vaststellen dat het ontbrekende nummer, X, is gelijk aan 20.

Laten we dit scenario enigszins wijzigen. We veronderstellen opnieuw dat we weten dat het gemiddelde van een gegevensset 25 is. Deze keer zijn de waarden in de gegevensset echter 20, 10 en twee onbekende waarden. Deze onbekenden kunnen verschillen, dus we gebruiken twee verschillende variabelen, X, en Y, om dit aan te duiden. De resulterende vergelijking is (20 + 10 + x + y) / 4 = 25. Met sommige algebra verkrijgen we Y = 70- X. De formule is in deze vorm geschreven om aan te geven dat zodra we een waarde kiezen voor X, de waarde voor Y is volledig bepaald. We moeten één keuze maken en dit laat zien dat er één mate van vrijheid is.

Nu zullen we kijken naar een steekproef van honderd. Als we weten dat het gemiddelde van deze voorbeeldgegevens 20 is, maar de waarden van geen van de gegevens kennen, zijn er 99 vrijheidsgraden. Alle waarden moeten optellen tot een totaal van 20 x 100 = 2000. Als we de waarden van 99 elementen in de gegevensset hebben, is de laatste bepaald.

Student t-score en Chi-Square distributie

Vrijheidsgraden spelen een belangrijke rol bij het gebruik van de Student t-scoretabel. Er zijn er eigenlijk meerdere t-score distributies. We maken onderscheid tussen deze distributies door gebruik te maken van vrijheidsgraden.

Hier hangt de kansverdeling die we gebruiken af ​​van de grootte van onze steekproef. Als onze steekproefgrootte is n, dan is het aantal vrijheidsgraden n-1. Voor een steekproefgrootte van 22 moeten we bijvoorbeeld de rij van de gebruiken t-scoretabel met 21 vrijheidsgraden.

Het gebruik van een chikwadraatverdeling vereist ook het gebruik van vrijheidsgraden. Hier, op dezelfde manier als bij de t-score distributie, bepaalt de steekproefgrootte welke distributie moet worden gebruikt. Als de steekproefgrootte is n, dan zijn er n-1 graden van vrijheid.

Standaardafwijking en geavanceerde technieken

Een andere plaats waar vrijheidsgraden verschijnen, is in de formule voor de standaardafwijking. Deze gebeurtenis is niet zo openlijk, maar we kunnen het zien als we weten waar we moeten kijken. Om een ​​standaardafwijking te vinden, zoeken we de "gemiddelde" afwijking van het gemiddelde. Na het aftrekken van het gemiddelde van elke gegevenswaarde en het kwadrateren van de verschillen, eindigen we door n-1 liever dan n zoals we zouden verwachten.

De aanwezigheid van de n-1 komt van het aantal vrijheidsgraden. Sinds de n gegevenswaarden en het steekproefgemiddelde worden gebruikt in de formule, die zijn er n-1 graden van vrijheid.

Meer geavanceerde statistische technieken gebruiken meer gecompliceerde manieren om de vrijheidsgraden te tellen. Bij het berekenen van de teststatistiek voor twee gemiddelden met onafhankelijke steekproeven van n1 en n2 elementen, het aantal vrijheidsgraden heeft een vrij ingewikkelde formule. Het kan worden geschat met behulp van de kleinere van n1-1 en n2-1

Een ander voorbeeld van een andere manier om de vrijheidsgraden te tellen, wordt geleverd met een F test. Bij het uitvoeren van een F test die we hebben k monsters elk van grootte n-de vrijheidsgraden in de teller zijn k-1 en in de noemer is k(n-1).