Functies met de T-distributie in Excel

Microsoft's Excel is handig bij het uitvoeren van basisberekeningen in statistieken. Soms is het handig om alle functies te kennen die beschikbaar zijn om met een bepaald onderwerp te werken. Hier zullen we de functies in Excel bekijken die verband houden met de t-verdeling van de student. Naast het uitvoeren van directe berekeningen met de t-verdeling, kan Excel ook betrouwbaarheidsintervallen berekenen en hypothesetests uitvoeren.

Functies met betrekking tot de T-distributie

Er zijn verschillende functies in Excel die rechtstreeks met de t-distributie werken. Gegeven een waarde langs de t-verdeling, retourneren de volgende functies allemaal het deel van de verdeling dat zich in de opgegeven staart bevindt.

Een deel in de staart kan ook worden geïnterpreteerd als een kans. Deze staartkansen kunnen worden gebruikt voor p-waarden in hypothesetests.

  • De functie T.VERD geeft de linkerstaart van de t-verdeling van Student terug. Deze functie kan ook worden gebruikt om de Y-waarde voor elk punt langs de dichtheidscurve.
  • De functie T.VERD.RT retourneert de rechterstaart van de t-verdeling van Student.
  • De functie T.VERD.2T retourneert beide staarten van de t-verdeling van Student.

Deze functies hebben allemaal vergelijkbare argumenten. Deze argumenten zijn, in volgorde:

  1. De waarde X, wat aangeeft waar langs de X as zijn we langs de verdeling
  2. Het aantal vrijheidsgraden.
  3. De functie T.VERD heeft een derde argument, waarmee we kunnen kiezen tussen een cumulatieve verdeling (door een 1 in te voeren) of niet (door een 0 in te voeren). Als we een 1 invoeren, retourneert deze functie een p-waarde. Als we een 0 invoeren, retourneert deze functie de Y-waarde van de dichtheidscurve voor het gegeven X.

Omgekeerde functies

Alle functies T.DIST, T.DIST.RT en T.DIST.2T hebben een gemeenschappelijke eigenschap. We zien hoe al deze functies beginnen met een waarde langs de t-verdeling en vervolgens een verhouding retourneren. Er zijn gelegenheden dat we dit proces willen omkeren. We beginnen met een verhouding en willen de waarde van t weten die overeenkomt met deze verhouding. In dit geval gebruiken we de juiste inverse functie in Excel.

  • De functie T.INV geeft de linksstaartinversie van de T-verdeling van Student terug.
  • De functie T.INV.2T retourneert de tweezijdige inverse van Student's T-verdeling.

Er zijn twee argumenten voor elk van deze functies. De eerste is de waarschijnlijkheid of het aandeel van de verdeling. De tweede is het aantal vrijheidsgraden voor de specifieke verdeling waar we nieuwsgierig naar zijn.

Voorbeeld van T.INV

We zullen een voorbeeld zien van zowel de T.INV- als de T.INV.2T-functies. Stel dat we werken met een T-verdeling met 12 vrijheidsgraden. Als we het punt langs de verdeling willen weten dat 10% van het gebied onder de curve links van dit punt uitmaakt, dan voeren we = T.INV (0,1,12) in een lege cel in. Excel retourneert de waarde -1.356.

Als we in plaats daarvan de T.INV.2T-functie gebruiken, zien we dat het invoeren van = T.INV.2T (0.1,12) de waarde 1.782 retourneert. Dit betekent dat 10% van het gebied onder de grafiek van de verdelingsfunctie links van -1.782 en rechts van 1.782 is.

In het algemeen, door de symmetrie van de t-verdeling, voor een waarschijnlijkheid P en vrijheidsgraden d we hebben T.INV.2T (P, d) = ABS (T.INV (P/ 2,d), waarbij ABS de absolute waardefunctie in Excel is.

Vertrouwensintervallen

Een van de onderwerpen over inferentiële statistieken betreft de schatting van een populatieparameter. Deze schatting neemt de vorm aan van een betrouwbaarheidsinterval. De schatting van een populatiegemiddelde is bijvoorbeeld een steekproefgemiddelde. De schatting heeft ook een foutmarge, die Excel zal berekenen. Voor deze foutmarge moeten we de functie CONFIDENCE.T gebruiken.

De documentatie van Excel zegt dat de functie CONFIDENCE.T naar verluidt het betrouwbaarheidsinterval retourneert met behulp van de t-verdeling van Student. Deze functie retourneert de foutmarge. De argumenten voor deze functie zijn, in de volgorde waarin ze moeten worden ingevoerd:

  • Alpha - dit is het niveau van significantie. Alpha is ook 1 - C, waarbij C het betrouwbaarheidsniveau aangeeft. Als we bijvoorbeeld een betrouwbaarheid van 95% willen, moeten we 0,05 invoeren voor alfa.
  • Standaardafwijking - dit is de standaardafwijking van het voorbeeld uit onze gegevensset.
  • Steekproefgrootte.

De formule die Excel gebruikt voor deze berekening is:

M =t*s/ √n

Hier is M voor marge, t* is de kritische waarde die overeenkomt met het niveau van vertrouwen, s is de standaarddeviatie van het monster en n is de steekproefgrootte.

Voorbeeld van betrouwbaarheidsinterval

Stel dat we een eenvoudige steekproef van 16 koekjes hebben en deze wegen. We vinden dat hun gemiddelde gewicht 3 gram is met een standaardafwijking van 0,25 gram. Wat is een betrouwbaarheidsinterval van 90% voor het gemiddelde gewicht van alle cookies van dit merk?

Hier typen we eenvoudig het volgende in een lege cel:

= CONFIDENCE.T (0.1,0.25,16)

Excel retourneert 0,109565647. Dit is de foutmarge. We trekken dit af en voegen dit ook toe aan ons steekproefgemiddelde, en dus is ons betrouwbaarheidsinterval 2,89 gram tot 3,11 gram.

Tests van betekenis

Excel zal ook hypothesetests uitvoeren die gerelateerd zijn aan de t-verdeling. De functie T.TEST retourneert de p-waarde voor verschillende significantietoetsen. De argumenten voor de functie T.TEST zijn:

  1. Matrix 1, die de eerste set voorbeeldgegevens geeft.
  2. Array 2, die de tweede set voorbeeldgegevens geeft
  3. Staarten, waarin we 1 of 2 kunnen invoeren.
  4. Type - 1 geeft een gepaarde t-test aan, 2 een test met twee steekproeven met dezelfde populatievariantie en 3 een test met twee steekproeven met verschillende populatievarianties.