Lagemaße – wozu?

Lagemaße (auch Lageparameter) sind Kennzahlen, die im Rahmen der deskriptiven Statistik genutzt werden. Sie treffen eine Aussage über die zentrale Tendenz von Variablen im Datensatz. Mit ihnen ist also erkennbar, wo in der Stichprobe die „Musik spielt“.

 

Die wichtigsten Lagemaße

Mittelwert

Der Mittelwert ist sehr häufig in Studien aber auch der Presse zu finden. Er wird auch arithmetisches Mittel genannt und ist die Summe der Merkmalsausprägungen geteilt durch die Anzahl. In einer Formel ausgedrückt, sieht das wie folgt aus:

    \[\overline{x}=\frac{1}{n} \sum_{i=1}^{n} x_i \]

 

Beispiel von Merkmalsausprägungen einer Variable: 1,2,3,4,5,6,7,8,9,10

    \[\overline{x}=\frac{1}{10} \times 55 = 5,5 \]

Der Mittelwert ist an sich ganz gut geeignet, ist aber potentiell verzerrt, wenn es besonders große oder kleine Werte gibt, die von den typischen Werten abweichen, wie folgendes Beispiel zeigt: 1,2,3,4,5,6,7,8,9,100

    \[\overline{x}=\frac{1}{10} \times 145 = 14,5 \]

 

Median

Der Median ist der Wert, der die Stichprobe in zwei gleich große Teile zerlegt. Ein Teil der Stichprobe ist größer als der Median, der andere Teil ist demnach kleiner. Er ist im Gegensatz zum Mittelwert gegenüber Ausreißern nicht anfällig. Per Formel berechnet sich der Median wie folgt:

    \[ {\displaystyle {\tilde {x}}={\begin{cases}x_{({\frac {n+1}{2}})}{\text{ falls }}n{\text{ ungerade - Fall a)}}\\{\frac {1}{2}}\left(x_{({\frac {n}{2}})}+x_{({\frac {n}{2}}+1)}\right){\text{ falls }}n{\text{ gerade - Fall b).}}\end{cases}}} \]

 

a) Beispielverteilung einer Variable mit ungerader Anzahl: 10,20,30,40,50,60,70,80,90

Da es sich mit n=9 um eine gerade Anzahl an Merkmalsausprägungen handelt, ist die erste Formel zu verwenden.

    \[ {\displaystyle {\tilde {x}}=x_{((9+1)/2)}=x_{(5)}=50} \]

Demnach ist der fünfte Wert (=50) der Median.

 

b) Beispielverteilung einer Variable mit gerader Anzahl: 10,20,30,40,50,60,70,80,90,100

    \[ \ {\tilde {x}}={\frac {1}{2}}\left(x_{({\frac {10}{2}})}+x_{({\frac {10}{2}}+1)}\right){\text \]

    \[ \text {hieraus ergibt sich: } x_5=50 \text { sowie } x_6 =60 \text { und somit } \frac {1}{2} \times  (50+60) = 55\]

 

Modus

Der Modus (auch Modalwert) ist der Wert in der Stichprobe, der am häufigsten vorkommt. Dieser ist häufig nur dann sinnvoll, wenn nicht übermäßig viele Merkmalsausprägungen von einer Variable existieren und eine hinreichend große Stichprobe existiert.

Beispielstichprobe: 1,1,2,3,4,4,4,5,5,6,7,7,8,9

Die 4 ist hier der Modus bzw. Modalwert, weil jene am häufigsten vorkommt, nämlich drei mal. Die 1, 5 und 7 kommen je zwei mal vor. Treten zwei oder mehr Werte gleich häufig auf, sind sie allesamt Modalwerte.

 

Weitere Lagemaße

Quantile und Quartile

Quantile teilen anhand eines Prozentwertes die Verteilung in zwei Abschnitte. Dies ist ähnlich dem Median. Das z.B. 0,7-Quantil ist der Wert, unter dem 70% und über dem 30% der Wert liegen. Quartile sind spezielle Quantile, die die Verteilung in Viertel teilen. Es gibt das 1. Quartil (=0,25 Quantil), das 2. Quartil (Median), das 3, Quartil (0,75 Quantil) und das 4, Quartil (Maximalwert). Ausführlicher und mit Beispielen und Berechnung gehe ich in diesem Artikel auf beides ein.

 

Getrimmtes arithmetisches Mittel

Der getrimmte Mittelwert schließt aus der Berechnung einen bestimmten Anteil der kleinsten und größten Elemente aus. Dies können 5% oder 10%. Effektiv wird also die Stichprobe für diese Berechnung verkleinert. Im Ergebnis hat man kaum/keine Verzerrung durch Ausreißer und damit einen robusteren Mittelwert. Bei einer Stichprobe mit 10 Fällen würden bei Ausschluss der 10% größten und kleinsten Werte lediglich 8 Fälle zur Berechnung des getrimmten Mittelwertes herangezogen werden.

Beispiel: 1,20,21,22,24,25,26,27,29,120

Der normale Mittelwert (siehe oben) beträgt 31,5. Der getrimmte Mittelwert beträgt 24,25, da die Werte 1 und 120 ausgeschlossen werden.

 

Geometrisches Mittel

Das geometrische Mittel bildet für eine Variable das Produkt der Werte aller Fälle der Stichprobe und zieht im Anschluss die Wurzel. Es ist allerdings nur für positive Werte anzuwenden. In einer Formel ausgedrückt, sieht das ganze so aus:

    \[ \bar{x}_\mathrm{geom} = \sqrt[n]{\prod_{i=1}^n{x_i}} = \sqrt[n]{x_1 \cdot x_2 \dotsm x_n} \]

Beispiel von Merkmalsausprägungen einer Variable: 1,2,3,4,5,6,7,8,9,10

    \[ \bar{x}_\mathrm{geom} = \sqrt[10]{3628800} = 4,529  \]