8. Zufallsvariable

Leitfragen

Eine Zufallsvariable (random variable) ist eine Funktion X:Ω →ℝn.

Beim Würfeln kann die Zufallsvariable die Augenzahl sein, bei zwei Würfen etwa die Summe der Augenzahlen (so dass die Stichprobe (1,3) auf 4 abgebildet wird) oder 0 für einen Pasch und 1 für einen Nicht-Pasch. Bei zufällig ausgewählten Personen könnten Zufallsvariablen das Alter, die Größe oder das Bruttoeinkommen sein, bei Wörtern ihre Länge, bei Zeichen ihr ASCII-Code, beim Münzwurf 0 für Blatt und 1 für Zahl.

Wir werden später das mit dem ℝn nicht mehr so eng sehen und z.B. auch Wörter als Zufallsvariablen akzeptieren. Dann werden aber Begriffe wie Erwartungswert (nächste Folie) sinnlos, weswegen wir das vorerst mal nicht tun.

Schreibweise:

P(X  = x ) := P ({ω ∈ Ω |X (ω ) = x}).

Darstellung der Verteilung (probability mass function, pmf, frequency function) PX(x) = P(X= x) von Zufallsvariablen (die dadurch definierte Wahrscheinlichkeit dafür, dass bei einem Experiment die Zufallsvariable X den Wert x erhält, ist also einfach die Summe der Wahrscheinlichkeiten aller Stichproben ω, die von X auf x abgebildet werden) in Histogrammen, hier für die Wortlänge in einem englischen (links) und deutschen (rechts) Text:

Natürlich ist das nicht wirklich das Histogramm einer Zufallsvariablen. Diese muss nämlich aus einem Modell kommen und nicht aus einer Beobachtung von Häufigkeiten. Allerdings werden wir in Kürze endlich eine Verbindung zwischen den beiden Größen herstellen. Genau genommen sollten in das Histogramm auch die Werte von P(X= x) eingetragen werden und nicht die rohen Zählungen. Dieser Defekt wäre allerdings durch schlichte Division durch die Gesamtzahl der Beobachtungen leicht heilbar.

Sind mehrere Zufallsvariablen X1,X2, auf einem Wahrscheinlichkeitsraum definiert – etwa die Gesamt-Augenzahl und die Anzahl der Würfe mit Ergebnis sechs beim n-fachen Würfeln –, so kann man sie zu einer gemeinsamen Zufallsvariable

X (ω ) = (X1 (ω),X2 (ω),...)

zusammenfassen (das Ergebnis ist also etwas wie ein Vektor).

Beispiel: Zweimaliges Würfeln. Zufallsvariablen: Augensumme, X1, Augen im ersten Wurf, X2; X1 läuft waagrecht, X2 läuft senkrecht.

2 3 4 5 6 7 8 9 10 11 12
1 136 136 136 136 136 136 0 0 0 0 0 16
2 0 136 136 136 136 136 136 0 0 0 0 16
3 0 0 136 136 136 136 136 136 0 0 0 16
4 0 0 0 136 136 136 136 136 136 0 0 16
5 0 0 0 0 136 136 136 136 136 136 0 16
6 0 0 0 0 0 136 136 136 136 136 136 16
136 236 336 436 5_36 636 536 436 336 236 136

In der Mitte der Tabelle ist die gemeinsame Verteilung von X= (X1,X2), an den Rändern stehen die Marginalverteilungen P(X1) und P(X2). Dabei ist P(X1) = ∑ X2X2P(X1,X2) und analog für P(X2).

Die Verteilungen Xn heißen 1-dimensionale Marginalverteilung (Randverteilung, marginal distribution) – sie entstehen durch Addition über alle nicht betrachteten Zufallsvariablen. Entsprechend lassen sich mehrdimensionale Marginalverteilungen definieren, z.B. (X2,X3) über der Gesamtvariablen (X1,X2,X3) durch Summation über X1.

Unabhängigkeit für Zufallsvariablen

Zwei Zufallsvariablen sind unabhängig, wenn für alle x1,x2

P (X1  =  x1,X2  = x2) = P (X1  = x1)P (X2  = x2 )

gilt (und analog für mehrfache Produkte).

Eine mögliche Verteilung der Zufallsvariablen Xl ” Wortlänge in einem deutschen Text“

Xl   1      2     3     4     5      6     7     8     9      10
P(X ) 0.065  0.108  0.224  0.152 0.102  0.088  0.053  0.043 0.039  0.037
 l
Xl   11     12    13    14    15     16    17    18    19     20
P(Xl) 0.026  0.020  0.011  0.008 0.008  0.004  0.002  0.004 0.002  0.007

Übungen zu diesem Abschnitt

Ihr solltet euch wenigstens an den rötlich unterlegten Aufgaben versuchen

(1)

Überlegt euch Beispiele für Zufallsvariablen, die in der Sprachverarbeitung vorkomemn könnten: Wortlänge, Summe der ASCII-Codes, Zahl der Wörter in einem Dokument, die mit Suchanfrage übereinstimmen wären ein paar Vorschläge von mir. Gebt dazu jeweils den Stichprobenraum und soweit sinnvoll die Abbildung Ω →ℝ an.

(2)

Erfindet eine Spielsprache mit vielleicht 10 Wörtern und fantasiert dazu eine Wahrscheinlichkeitsverteilung. Berechnet dann die Verteilung für die Zufallsvariablen Wortlänge und Zeichenindex (a=1, b=2...) des ersten Zeichens. Berechnet deren gemeinsame Verteilung. Sind die R.V.s unabhängig? Sollten sie es sein? Ratet, wie das wohl im Deutschen ist. Wenn ihr wollt, könnt ihr auch gerne ein Programm schreiben und aus einem größeren Korpus die beiden Verteilungen schätzen – allerdings sei warnend angemerkt, dass wir bisher nicht mal ordentlich schätzen können, geschweige denn wirklich testen, ob die beiden Verteilungen unabhängig sind.


Markus Demleitner

Copyright Notice