die Wahrscheinlichkeitsverteilung der Anzahl der Bernoulli-Versuche, die notwendig sind, um einen Erfolg zu haben. Diese Verteilung ist auf der Menge definiert.
Variante B
die Wahrscheinlichkeitsverteilung der Anzahl der Fehlversuche vor dem ersten Erfolg. Diese Verteilung ist auf der Menge definiert.
Die beiden Varianten stehen in der Beziehung . Welche davon man „geometrische Verteilung“ nennt, wird entweder vorher festgelegt oder man wählt diejenige, die gerade zweckmäßiger ist.
Die geometrische Verteilung wird verwendet:
bei der Analyse der Wartezeiten bis zum Eintreffen eines bestimmten Ereignisses.
bei der Lebensdauerbestimmung von Geräten und Bauteilen, d. h. dem Warten bis zum ersten Ausfall
bei der Bestimmung der Anzahl häufiger Ereignisse zwischen unmittelbar aufeinanderfolgenden seltenen Ereignissen wie zum Beispiel Fehlern:
Bestimmung der Fehlerrate in der Datenübertragung, zum Beispiel Anzahl der erfolgreich übertragenen TCP-Pakete zwischen zwei Paketen mit Retransmission
Eine diskrete Zufallsgröße oder mit dem Parameter (Wahrscheinlichkeit für einen Erfolg), (Wahrscheinlichkeit für einen Misserfolg) genügt der geometrischen Verteilung , wenn:
Variante A
Für die Wahrscheinlichkeit, dass man genau Versuche benötigt, um zum ersten Erfolg zu kommen, gilt
Variante B
Für die Wahrscheinlichkeit, Fehlversuche vor dem ersten Erfolg zu haben, gilt
In beiden Fällen bilden die Werte für die Wahrscheinlichkeiten eine geometrische Folge.
Der Erwartungswert lässt sich per Fallunterscheidung zerlegen. Mit Wahrscheinlichkeit geht das erste Experiment erfolgreich aus, das heißt, wird mit 1 realisiert. Mit Wahrscheinlichkeit ist das erste Experiment erfolglos, aber der Erwartungswert für die Anzahl der dann noch folgenden Experimente ist wegen der Gedächtnislosigkeit wiederum . Also gilt
, also .
Führt man Experimente durch, so ist der Erwartungswert für die Anzahl der erfolgreichen Experimente . Daher ist der zu erwartende Abstand zwischen zwei erfolgreichen Experimenten (einschließlich eines erfolgreichen Experimentes) , also .
Die geometrische Verteilung ist eine gedächtnislose Verteilung, d. h., es gilt für
Variante A
Variante B
Ist also von einer geometrisch verteilten Zufallsvariablen bekannt, dass sie größer als der Wert ist (Variante A) bzw. mindestens den Wert hat (Variante B), so ist die Wahrscheinlichkeit, dass sie diesen Wert um übertrifft, genau so groß wie die, dass eine identische Zufallsvariable überhaupt den Wert annimmt.
Die Gedächtnislosigkeit ist eine definierende Eigenschaft; die geometrische Verteilung ist also die einzig mögliche gedächtnislose diskrete Verteilung. Ihr stetiges Pendant hierbei ist die Exponentialverteilung.
Die Summe unabhängiger geometrisch verteilter Zufallsgrößen mit demselben Parameter ist nicht geometrisch verteilt, sondern negativ binomialverteilt. Somit ist die Familie der geometrischen Wahrscheinlichkeitsverteilungen nichtreproduktiv.
Verallgemeinerung auf mehrere Erfolge
Eine Verallgemeinerung der geometrischen Verteilung stellt die negative Binomialverteilung dar, die die Wahrscheinlichkeit angibt, dass für Erfolge Versuche notwendig sind bzw. (in einer alternativen Darstellung) dass der -te Erfolg eintritt, nachdem bereits Misserfolge eingetreten sind.
Umgekehrt ist die geometrische Verteilung eine negative Binomialverteilung mit . Somit gilt für die Faltung der geometrische Verteilung
.
Konvergenz der geometrischen Verteilung
Für eine Folge geometrisch verteilter Zufallsvariablen mit Parametern gelte mit einer positiven Konstante . Dann konvergiert die Folge für große gegen eine exponentialverteilte Zufallsvariable mit Parameter .
In Analogie zur diskreten geometrischen Verteilung bestimmt die stetige Exponentialverteilung die Wartezeit bis zum ersten Eintreffen eines seltenen Poisson-verteilten Ereignisses. Die Exponentialverteilung ist also das kontinuierliche Analogon zur diskreten geometrischen Verteilung.
Beziehung zur zusammengesetzten Poisson-Verteilung
Die geometrische Verteilung lässt sich aus dem Urnenmodell herleiten, wenn
ist. Dann entsteht die geometrische Verteilung beim Ziehen mit Zurücklegen aus einer Urne mit Kugeln, von denen markiert sind. Sie ist dann die Wartezeit auf den ersten Erfolg.
Zufallszahlen zur geometrischen Verteilung werden üblicherweise mit Hilfe der Inversionsmethode erzeugt. Diese Methode bietet sich bei der geometrischen Verteilung besonders an, da die Einzelwahrscheinlichkeiten der einfachen Rekursion genügen. Die Inversionsmethode ist hier also nur mit rationalen Operationen (Addition, Multiplikation) und ohne die Verteilungsfunktion vorher zu berechnen und abzuspeichern durchführbar, was einen schnellen Algorithmus zur Simulation garantiert.