De normale benadering van de binomiale verdeling

Van willekeurige variabelen met een binomiale verdeling is bekend dat ze discreet zijn. Dit betekent dat er een telbaar aantal uitkomsten kan optreden in een binomiale verdeling, met een scheiding tussen deze uitkomsten. Een binomiale variabele kan bijvoorbeeld een waarde van drie of vier hebben, maar geen getal tussen drie en vier.

Met het discrete karakter van een binomiale verdeling, is het enigszins verrassend dat een continue willekeurige variabele kan worden gebruikt om een binomiale verdeling te benaderen. Voor veel binomiale verdelingen kunnen we een normale verdeling gebruiken om onze binomiale waarschijnlijkheden te benaderen.

Dit is te zien als je ernaar kijkt n munten gooien en verhuren X wees het aantal hoofden. In deze situatie hebben we een binomiale verdeling met kans van slagen als p = 0,5. Naarmate we het aantal worpen vergroten, zien we dat het waarschijnlijkheidshistogram steeds meer op een normale verdeling lijkt.

Verklaring van de normale benadering

Elke normale verdeling wordt volledig gedefinieerd door twee reële getallen. Deze getallen zijn het gemiddelde, dat het middelpunt van de verdeling meet, en de standaardafwijking, die de spreiding van de verdeling meet. Voor een gegeven binomiale situatie moeten we kunnen bepalen welke normale distributie we moeten gebruiken.

De selectie van de juiste normale verdeling wordt bepaald door het aantal proeven n in de binomiale setting en de constante kans op succes p voor elk van deze proeven. De normale benadering voor onze binomiale variabele is een gemiddelde van np en een standaardafwijking van (np(1 - p)^0.5.

Stel bijvoorbeeld dat we elk van de 100 vragen van een multiple-choice test hebben geraden, waarbij elke vraag één correct antwoord had op vier keuzes. Het aantal juiste antwoorden X is een binomiale willekeurige variabele met n = 100 en p = 0,25. Deze willekeurige variabele heeft dus een gemiddelde van 100 (0,25) = 25 en een standaardafwijking van (100 (0,25) (0,75))^0.5 = 4,33. Een normale verdeling met gemiddelde 25 en standaardafwijking van 4,33 zal werken om deze binomiale verdeling te benaderen.

Wanneer is de benadering geschikt?

Door wat wiskunde te gebruiken, kan worden aangetoond dat er een paar voorwaarden zijn die we nodig hebben om een normale benadering van de binomiale verdeling te gebruiken. Het aantal observaties n moet groot genoeg zijn, en de waarde van p zodat beide np en n(1 - p) groter dan of gelijk aan 10. Dit is een vuistregel, die wordt geleid door statistische praktijk. De normale benadering kan altijd worden gebruikt, maar als niet aan deze voorwaarden wordt voldaan, is de benadering mogelijk niet zo goed als een benadering.

Bijvoorbeeld als n = 100 en p = 0,25 dan zijn we gerechtvaardigd om de normale benadering te gebruiken. Dit is zo omdat np = 25 en n(1 - p) = 75. Omdat beide getallen groter zijn dan 10, zal de juiste normale verdeling redelijk goed werk maken van het schatten van binomiale kansen.

Waarom de benadering gebruiken?

Binomiale kansen worden berekend met behulp van een zeer eenvoudige formule om de binomiale coëfficiënt te vinden. Helaas, vanwege de faculteiten in de formule, kan het heel eenvoudig zijn om rekenproblemen te krijgen met de binomiale formule. Met de normale benadering kunnen we al deze problemen omzeilen door met een bekende vriend, een tabel met waarden van een standaard normale verdeling, te werken.

Vaak is de bepaling van een waarschijnlijkheid dat een binomiale willekeurige variabele binnen een bereik van waarden valt moeilijk te berekenen. Dit komt omdat om de kans te vinden dat een binomiale variabele X groter is dan 3 en kleiner dan 10, zouden we de waarschijnlijkheid moeten vinden dat X is gelijk aan 4, 5, 6, 7, 8 en 9 en tel dan al deze waarschijnlijkheden bij elkaar op. Als de normale benadering kan worden gebruikt, moeten we in plaats daarvan de z-scores bepalen die overeenkomen met 3 en 10 en vervolgens een waarschijnlijkheidstabel voor de standaard normale verdeling gebruiken..

Wetenschap