Ziel des Tests auf Normalverteilung

Eine Grundvoraussetzung von parametrischen Tests wie z.B. dem t-Test ist, das die Daten normalverteilt sind. Auch eine Regression setzt normalverteilte Residuen voraus. Daher ist es notwendig, die jeweiligen Daten auf Normalverteilung zu testen. Prinzipiell gibt es dazu die grafische als auch die analytische Methode, die ich nachfolgend vorstellen werde.

Normalverteilung testen: Grafische Methode

Es gibt insgesamt drei Diagramme, die häufig zur Prüfung der Daten auf Normalverteilung herangezogen werden:

  1. Histogramm mit Normalverteilungskurve,
  2. Q-Q-Diagramm,
  3. Trendbereinigtes Q-Q-Diagramm.
Dieses Video ansehen auf YouTube.

Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.

Zu finden sind die Diagramme über Analysieren -> Deskriptive Statistiken -> Explorative Datenanalyse. Im darauffolgenden Dialogfeld ist unter Diagramme ein Haken bei „Normalverteilungsdiagramm mit Tests“ zu setzen und mit OK zu bestätigen. Sollte das Histogramm ohne Normalverteilungskurve (z.B. in SPSS 25) erscheinen, hilft folgender Syntax: 

FREQUENCIES VARIABLES=Variable
/HISTOGRAM NORMAL

Interpretation der Diagramme 

1. Histogramm mit Normalverteilungskurve: Die Häufigkeiten der Werte sind in Form von Säulen abgetragen. Eine Linie, die Normalverteilung repräsentiert, ist darüber gelegt. Sollten folglich die Säulen ungefähr mit der Linie korrespondieren, liegen normalverteilte Daten vor.

2. Im Q-Q-Diagramm sollten die Punkte ungefähr auf der Linie liegen. Die Linie repräsentiert die Gleichheit zwischen theoretischer Normalverteilung und empirisch beobachteter Verteilung. Liegen also alle Punkte exakt auf der Linie, sind die Daten normalverteilt. Liegen sie hingegen nahe der Kurve kann zumeist noch von Normalverteilung ausgegangen werden.

 

3. Im trendbereinigten Q-Q-Diagramm ist die theoretische Normalverteilung eine horizontale Linie, welche exakt auf  der x-Achse liegt. Meist sehen diese Diagramme aufgrund der Trendbereinigung sehr abenteuerlich aus, speziell an den Enden der Verteilung – es sind meist die Ausreißer, die sehr spektakulär anmuten. Liegen die Punkte in der Mitte der Abbildung recht nah an der Gerade, geht man von Normalverteilung aus.

 

Normalverteilung testen – Analytische Methode

Die analytische Methode sieht zumeist den Kolmogorov-Smirnov und den Shapiro-Wilk-Test vor. Beide Tests gehen in ihrer Nullhypothese davon aus, dass Normalverteilung der Daten vorliegt. Es sollte also sowohl bei dem Klomogorov-Smirnov als auch dem Shapiro-Wil-Test das Ziel sein, die Nullhypothese nicht verwerfen zu können. Hierfür ist es notwendig, dass der Signifikanzwert (sog. p-Wert) über 0,05 liegt. In der Tabelle sieht man, dass der Kolmogorov-Smirnov-Test eine Signifikanz von 0,200 und der Shapiro-Wilk-Test von 0,484 hat. Sie behalten demzufolge die Nullhypothese bei und es konnte keine Abweichung von der Normalverteilung gezeigt werden.

 

 

ACHTUNG: Beide Tests können zu fehlerhaften Aussagen führen. Warum und was man dagegen tun kann, zeige ich in diesem Artikel ausführlich.

Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.