De negatieve binomiale verdeling is een waarschijnlijkheidsverdeling die wordt gebruikt met discrete willekeurige variabelen. Dit type distributie betreft het aantal proeven dat moet plaatsvinden om een vooraf bepaald aantal successen te behalen. Zoals we zullen zien, is de negatieve binomiale verdeling gerelateerd aan de binomiale verdeling. Bovendien generaliseert deze verdeling de geometrische verdeling.
We zullen eerst kijken naar zowel de instelling als de omstandigheden die aanleiding geven tot een negatieve binomiale verdeling. Veel van deze aandoeningen lijken erg op een binomiale instelling.
Deze drie voorwaarden zijn identiek aan die in een binomiale verdeling. Het verschil is dat een binomiale willekeurige variabele een vast aantal proeven heeft n. De enige waarden van X zijn 0, 1, 2, ... , n, dus dit is een eindige verdeling.
Een negatieve binomiale verdeling betreft het aantal proeven X dat moet gebeuren totdat we dat hebben gedaan r successen. Het nummer r is een geheel getal dat we kiezen voordat we onze tests uitvoeren. De willekeurige variabele X is nog steeds discreet. Nu kan de willekeurige variabele echter waarden van aannemen X = r, r + 1, r + 2,… Deze willekeurige variabele is ontelbaar oneindig, omdat het willekeurig lang kan duren voordat we het verkrijgen r successen.
Om een negatieve binomiale verdeling te helpen begrijpen, is het de moeite waard om een voorbeeld te overwegen. Stel dat we een eerlijke munt omdraaien en we stellen de vraag: "Wat is de kans dat we in de eerste drie koppen krijgen X munten omdraaien? "Dit is een situatie die vraagt om een negatieve binomiale verdeling.
De munten hebben twee mogelijke uitkomsten, de kans op succes is een constante 1/2 en de proeven zijn onafhankelijk van elkaar. We vragen naar de kans om de eerste drie koppen erna te krijgen X munt slaat weg. We moeten de munt dus minstens drie keer omdraaien. We blijven dan flippen totdat de derde kop verschijnt.
Om de kansen te berekenen die verband houden met een negatieve binomiale verdeling, hebben we wat meer informatie nodig. We moeten de kansmassafunctie kennen.
De kansmassafunctie voor een negatieve binomiale verdeling kan met een beetje gedachte worden ontwikkeld. Elke proef heeft een kans van slagen gegeven door p. Aangezien er slechts twee mogelijke uitkomsten zijn, betekent dit dat de faalkans constant is (1 - p ).
De rhet succes moet optreden voor de Xe en laatste proces. De vorige X - 1 proeven moeten precies bevatten r - 1 successen. Het aantal manieren waarop dit kan gebeuren, wordt bepaald door het aantal combinaties:
C (X - 1, r -1) = (x - 1)! / [(R - 1)! (x - r)!].
Daarnaast hebben we onafhankelijke evenementen, en dus kunnen we onze kansen samen vermenigvuldigen. Alles bij elkaar opgeteld, verkrijgen we de kansmassafunctie
f(X) = C (X - 1, r -1) pr(1 - p)X - r.
We kunnen nu begrijpen waarom deze willekeurige variabele een negatieve binomiale verdeling heeft. Het aantal combinaties dat we hierboven zijn tegengekomen, kan anders worden ingesteld door in te stellen x - r = k:
(x - 1)! / [(r - 1)! (x - r)!] = (x + k - 1)! / [(R - 1)! k!] = (r + k - 1) (x + k - 2)… (r + 1) (r) /k! = (-1)k(-r) (- r - 1)… (-r - (k + 1) / k!.
Hier zien we het verschijnen van een negatieve binomiale coëfficiënt, die wordt gebruikt wanneer we een binomiale uitdrukking (a + b) verhogen naar een negatieve macht.
Het gemiddelde van een verdeling is belangrijk om te weten, omdat het een manier is om het centrum van de verdeling aan te duiden. Het gemiddelde van dit type willekeurige variabele wordt gegeven door de verwachte waarde en is gelijk aan r / p. We kunnen dit zorgvuldig bewijzen door de moment-genererende functie voor deze distributie te gebruiken.
Intuïtie leidt ons ook naar deze uitdrukking. Stel dat we een reeks proeven uitvoeren n1 totdat we verkrijgen r successen. En dan doen we dit opnieuw, alleen deze keer duurt het n2 trials. We blijven dit keer op keer doen, totdat we een groot aantal groepen proeven hebben N = n1 + n2 +... + nk.
Elk van deze k proeven bevat r successen, en dus hebben we er een totaal van kr successen. Als N is groot, dan zouden we verwachten te zien np successen. Dus we vergelijken deze samen en hebben kr = Np.
We doen wat algebra en vinden dat N / k = r / p. De fractie aan de linkerkant van deze vergelijking is het gemiddelde aantal proeven dat nodig is voor elk van onze k groepen proeven. Met andere woorden, dit is het verwachte aantal keren om het experiment uit te voeren, zodat we er een totaal van hebben r successen. Dit is precies de verwachting die we willen vinden. We zien dat dit gelijk is aan de formule r / p.
De variantie van de negatieve binomiale verdeling kan ook worden berekend met behulp van de moment genererende functie. Wanneer we dit doen, zien we de variantie van deze verdeling wordt gegeven door de volgende formule:
r (1 - p) /p2
De moment genererende functie voor dit type willekeurige variabele is vrij ingewikkeld. Bedenk dat de moment genererende functie is gedefinieerd als de verwachte waarde E [etX]. Door deze definitie te gebruiken met onze waarschijnlijkheidsmassafunctie, hebben we:
M (t) = E [etX] = Σ (x - 1)! / [(R - 1)! (x - r)!] EtXpr(1 - p)X - r
Na enige algebra wordt dit M (t) = (pet)r[1- (1- p) et]-r
We hebben hierboven gezien hoe de negatieve binomiale verdeling in veel opzichten vergelijkbaar is met de binomiale verdeling. Naast dit verband is de negatieve binomiale verdeling een meer algemene versie van een geometrische verdeling.
Een geometrische willekeurige variabele X telt het aantal proeven dat nodig is voordat het eerste succes optreedt. Het is gemakkelijk te zien dat dit precies de negatieve binomiale verdeling is, maar dan met r gelijk aan één.
Andere formuleringen van de negatieve binomiale verdeling bestaan. Sommige schoolboeken definiëren X om het aantal proeven te zijn tot r er treden fouten op.
We zullen een voorbeeldprobleem bekijken om te zien hoe te werken met de negatieve binomiale verdeling. Stel dat een basketbalspeler een 80% vrije worpschutter is. Veronderstel verder dat het maken van de ene vrije worp onafhankelijk is van de volgende. Wat is de kans dat voor deze speler de achtste basket wordt gemaakt op de tiende vrije worp?
We zien dat we een instelling hebben voor een negatieve binomiale verdeling. De constante kans op succes is 0,8, en dus is de kans op falen 0,2. We willen de kans op X = 10 bepalen wanneer r = 8.
We stoppen deze waarden in onze kansmassafunctie:
f (10) = C (10 -1, 8 - 1) (0.8)8(0,2)2= 36 (0,8)8(0,2)2, wat ongeveer 24% is.
We kunnen dan vragen wat het gemiddelde aantal vrije worpen is voordat deze speler er acht maakt. Aangezien de verwachte waarde 8 / 0,8 = 10 is, is dit het aantal opnamen.