9. Erwartungswert und Varianz

Leitfragen

Der Erwartungswert (expectation) einer Zufallsvariablen X ist definiert als

∑
E (X ) =     X (ω )P(ω ).
         ω∈Ω

Wenn X= {x1,x2,,xn} den Wertebereich von X bezeichnet, ist das gleichbedeutend mit

∑
E (X ) =    xP (X  = x ).
         x∈< strong><em>X</em></strong>

In der zweiten Form der Definition habe ich die Schreibweise

∑
P (X  = x) :=           P (ω).

              ω |X(ω)=x

Damit ist auch klar, warum die beiden Formen äquivalent sind:

ω∑∈ Ω X (ω)P (ω)
       ∑                          ∑
=x1           P (ω ) + ⋅⋅⋅ + xn          P (ω)
   ω |X (ω)=x1                ω|X (ω)=xn
  ∑
=     xP (X =  x).
  x ∈<strong><em>X</em></strong>

In Wirklichkeit haben wir etwas betrogen, weil wir uns auf endliche Wertebereiche beschränkt haben, aber das funktioniert auch sonst.

Anmerkungen:

  1. Das entspricht einer Art mit den Wahrscheinlichkeiten gewichteten Mittelwert aller Werte, die die Zufallsvariable annehmen kann.
  2. So etwas würde mit den Elementen von Ω zunächst nicht gehen, weil auf ihnen, selbst wenn wir sie 1, 2, 3 nennen, keine Arithmetik definiert ist. Deshalb kommt die Definition erst hier, obwohl ” Mittelwert“ ein eigentlich sehr natürlicher Begriff sind.
  3. Die Schreibweise E(X) deutet an, dass E eine Funktion ist. Mit einem ausreichend allgemeinen Funktionsbegriff ist das auch so, im Allgemeinen aber bezeichnet man Funktionen, die Funktionen (hier das X) auf Zahlen abbilden, als Funktionale. Deshalb wird in der Literatur auch häufig EX oder E[X] für E(X) geschrieben. Uns braucht das nicht zu kümmern, solange wir im Kopf behalten, dass X eben keine Zahl ist.

Der Erwartungswert ist linear:

E (λX ) = λE (X )    E (X + Y ) = E (X ) + E (Y )

für ein λ∈ℝ.

Wenn X und Y unabhängig sind, ist E(XY) = E(X)E(Y).

Die zweite Behauptung folgt aus

∑
E (XY  ) =     X (ω )Y (ω )P(ω )
           ω∈Ω
           ∑  ∑
        =         xyP (X  = x, Y =  y)
           x∈< strong><em>X</em></strong>y∈<strong><em>Y</em></strong>
           ∑  ∑
        =         xyP (X  = x )P (Y  = y)
           x∈< strong><em>X</em></strong>y∈<strong><em>Y</em></strong>
                 ∑
        =  E(X )    yP (Y  = y)
                 y∈< strong><em>Y</em></strong>
        =  E(X )E (Y ).

Dabei haben wir im Schluss von der zweiten auf die dritte Zeile die Unabhängigkeit ausgenutzt und im Schluss von der dritten auf die vierte Zeile einfach ausgeklammert (∑ ixi= xii). Das geht hier, weil xi und yi unabhängig voneinander variieren und keine Abhängigkeit der einzelnen Faktoren besteht.

Trotzdem haben hier etwas betrogen. X ist nämlich auch bei uns häufig nicht endlich, und wenn die Summen über abzählbar unendliche Mengen ausgeführt werden, sind die Operationen, die wir hier machen, nicht unkritisch – in der Tat funktioniert das aber auch streng.

Schließlich: Die Schreibweise λX soll einfach die Zufallsvariable bezeichnen, in der jeder Wert mit λ multipliziert wird. Ist etwa der Wertebereich von X, ” Augenzahl beim sechsseitigen Würfel“ {1,2,,6}, ist der Wertebereich von 3X einfach {3,6,9,,18}.

Beispiel: Sechsseitiger Würfel, X ist ” Augenzahl“:

6
        ∑   1-
E(X ) =     6i = 1∕6 +  2∕6 + ⋅⋅⋅ = 21 ∕6 = 3.5.
        i=1

Diese Aussage werden wir bald als ” Wenn wir wirklich oft würfeln, wird jeder Wurf im Mittel dreieinhalb Augen beitragen“ interpretieren können.

Nochmal Wortlängen Xl. Nach der Tabelle berechnet sich

E (Xl) = 1 ⋅ 0.065 + 2 ⋅ 0.108 + 3 ⋅ 0.224 + ⋅⋅⋅ = 5.26.

Für einen englischen Text könnte E(Xl) = 4.62 sein.

Varianz

Die Varianz einer Zufallsvariable X ist definiert als

(              )
                          2
Var(X ) = E  (X  - E (X ))
        = E (X2 ) - E2 (X )
          ∑
        =     (x -  E(X ))2P (X  = x)
           x∈<strong><em>X</em></strong>

Die Varianz ist nicht linear: Var(λX) = λ2Var(X). Unter anderem deshalb arbeitet man gern mit ihrer Wurzel, der Standardabweichung σX = ∘Var-(X-)-.

Momente

Allgemein heißt E(Xn) n-tes Moment, E((X-E(X))n) n-tes zentrales Moment. Der Erwartungswert ist also das erste Moment, die Varianz das zweite zentrale Moment.

Mehrere Variable, Kovarianz

Wenn X und Y unabhängig sind, gilt Var(X+ Y) = Var(X) + Var(Y)

Das lässt sich einsehen, wenn man das Argument des Erwartungswerts ausrechnet, der für Var(X+ Y) zu berechnen ist (dazu muss offenbar drei Mal die binomische Formel angewendet und die Linearität des Erwartungswerts genutzt werden):

((X  +(Y ) - E (X  + Y ))2)    (                                         )
          =  X2  + 2XY   + Y 2  - 2  XE  (X ) + Y (E (X ) + XE (Y ) + Y (E(Y )
                                  (                                )
                                +   E(X )2 + 2E (X )E (Y ) + E (Y )2

= (X  - E (X ))2 + (Y  - E (Y ))2 + 2XY   - 2XE  (Y ) - 2Y E(X ) + 2E (X )E (Y ).

Der erste Teil der letzten Zeile ist im Erwartungswert schon das Ergebnis, der zweite Teil im Erwartungswert Null:

(                                           )
E  2XY   - 2XE  (Y ) - 2Y E(X ) + 2E (X )E (Y ) =  2E (XY ) - 4E (X )E (Y ) + 2E (X )E (Y );

der erste Summand ist aber (und hier kommt die Unabhängigkeit) 2E(X)E(Y), der gesamte Ausdruck also Null.

Sind X, Y Zufallsvariablen über Ω, so heißt

(                        )
Cov (X, Y ) = E  (X  - E (X ))(Y - E (Y ))
     ∑   (              )(              )
  =       X (ω ) - E (X )  Y (ω ) - E(Y ) P (ω )
    ω ∈Ω

Kovarianz von X und Y. Sie ist ein Maß für die Ähnlichkeit der Verteilung. Als Korrelationskoeffizient wird die Größe

ρXY  = Cov (X, Y )∕(σX σY )

bezeichnet.

Die Kovarianz von unabhängigen Zufallsvariablen ist Null, denn mit X und Y sind auch X-E(X) und Y-E(Y) unabhängig, und daher ist

(                          )
E  ((X  - E (X ))((Y  - E (Y ))  =  E ((X  - E (X ))E ((Y  - E (Y )).

Wegen der Linearität des Erwartungswertes ist weiter E(X-E(X)) = E(X) -E(E(X)) = 0. Die Kovarianz ist also ein Maß dafür, wie groß die Abhängigkeit von X und Y ist.

Übungen zu diesem Abschnitt

Ihr solltet euch wenigstens an den rötlich unterlegten Aufgaben versuchen

(1)

Rechnet den Erwartungswert der Zufallsvariable ” Zwei Würfelwürfe, Summe davon“ aus (Vorsicht: PX ist keine Gleichverteilung).

(2)

Weist nach, dass der Erwartungswert linear ist (d.h., dass die Definitionsgleichungen für Linearität für die spezielle Form des Erwartungswerts erfüllt sind. Macht euch klar, dass Linearität eine sehr spezielle Eigenschaft ist (z.B. indem ihr mal seht, ob x2 oder 1∕x linear sind.

(3)

Wenn X die Ordnungszahl des ersten Zeichens eines Wortes ist, was ist dann die Interpretation für E(X)? Was könnte man aus E(X) <14 schließen?

(4)

Rechnet die Varianz der Zufallsvariablen ” Augenzahl eines sechsseitigen Würfels“ aus und macht euch klar, dass dieser Wert nicht linear ist (z.B. indem ihr annehmt, dass jemand die Augen beim Würfel einfach verdoppelt hat und jetzt 2, 4, herauskommt).

(5)

Rechnet die Kovarianz der beiden Zufallsvariablen im Babysprachenbeispiel aus.


Markus Demleitner

Copyright Notice