Microsoft's Excel is handig bij het uitvoeren van basisberekeningen in statistieken. Soms is het handig om alle functies te kennen die beschikbaar zijn om met een bepaald onderwerp te werken. Hier zullen we de functies in Excel bekijken die verband houden met de t-verdeling van de student. Naast het uitvoeren van directe berekeningen met de t-verdeling, kan Excel ook betrouwbaarheidsintervallen berekenen en hypothesetests uitvoeren.
Er zijn verschillende functies in Excel die rechtstreeks met de t-distributie werken. Gegeven een waarde langs de t-verdeling, retourneren de volgende functies allemaal het deel van de verdeling dat zich in de opgegeven staart bevindt.
Een deel in de staart kan ook worden geïnterpreteerd als een kans. Deze staartkansen kunnen worden gebruikt voor p-waarden in hypothesetests.
Deze functies hebben allemaal vergelijkbare argumenten. Deze argumenten zijn, in volgorde:
Alle functies T.DIST, T.DIST.RT en T.DIST.2T hebben een gemeenschappelijke eigenschap. We zien hoe al deze functies beginnen met een waarde langs de t-verdeling en vervolgens een verhouding retourneren. Er zijn gelegenheden dat we dit proces willen omkeren. We beginnen met een verhouding en willen de waarde van t weten die overeenkomt met deze verhouding. In dit geval gebruiken we de juiste inverse functie in Excel.
Er zijn twee argumenten voor elk van deze functies. De eerste is de waarschijnlijkheid of het aandeel van de verdeling. De tweede is het aantal vrijheidsgraden voor de specifieke verdeling waar we nieuwsgierig naar zijn.
We zullen een voorbeeld zien van zowel de T.INV- als de T.INV.2T-functies. Stel dat we werken met een T-verdeling met 12 vrijheidsgraden. Als we het punt langs de verdeling willen weten dat 10% van het gebied onder de curve links van dit punt uitmaakt, dan voeren we = T.INV (0,1,12) in een lege cel in. Excel retourneert de waarde -1.356.
Als we in plaats daarvan de T.INV.2T-functie gebruiken, zien we dat het invoeren van = T.INV.2T (0.1,12) de waarde 1.782 retourneert. Dit betekent dat 10% van het gebied onder de grafiek van de verdelingsfunctie links van -1.782 en rechts van 1.782 is.
In het algemeen, door de symmetrie van de t-verdeling, voor een waarschijnlijkheid P en vrijheidsgraden d we hebben T.INV.2T (P, d) = ABS (T.INV (P/ 2,d), waarbij ABS de absolute waardefunctie in Excel is.
Een van de onderwerpen over inferentiële statistieken betreft de schatting van een populatieparameter. Deze schatting neemt de vorm aan van een betrouwbaarheidsinterval. De schatting van een populatiegemiddelde is bijvoorbeeld een steekproefgemiddelde. De schatting heeft ook een foutmarge, die Excel zal berekenen. Voor deze foutmarge moeten we de functie CONFIDENCE.T gebruiken.
De documentatie van Excel zegt dat de functie CONFIDENCE.T naar verluidt het betrouwbaarheidsinterval retourneert met behulp van de t-verdeling van Student. Deze functie retourneert de foutmarge. De argumenten voor deze functie zijn, in de volgorde waarin ze moeten worden ingevoerd:
De formule die Excel gebruikt voor deze berekening is:
M =t*s/ √n
Hier is M voor marge, t* is de kritische waarde die overeenkomt met het niveau van vertrouwen, s is de standaarddeviatie van het monster en n is de steekproefgrootte.
Stel dat we een eenvoudige steekproef van 16 koekjes hebben en deze wegen. We vinden dat hun gemiddelde gewicht 3 gram is met een standaardafwijking van 0,25 gram. Wat is een betrouwbaarheidsinterval van 90% voor het gemiddelde gewicht van alle cookies van dit merk?
Hier typen we eenvoudig het volgende in een lege cel:
= CONFIDENCE.T (0.1,0.25,16)
Excel retourneert 0,109565647. Dit is de foutmarge. We trekken dit af en voegen dit ook toe aan ons steekproefgemiddelde, en dus is ons betrouwbaarheidsinterval 2,89 gram tot 3,11 gram.
Excel zal ook hypothesetests uitvoeren die gerelateerd zijn aan de t-verdeling. De functie T.TEST retourneert de p-waarde voor verschillende significantietoetsen. De argumenten voor de functie T.TEST zijn: