Ziel des Welch-Tests (Welch t-Test bei ungleichen Varianzen)

Der Welch-Test testet unabhängige Stichproben darauf, ob bei mehr zwei unabhängigen Stichproben die Mittelwerte unterschiedlich sind. Allerdings benötigt der Welch-Test im Gegensatz zum normalen t-Test keine homogenen Varianzen. Das bedeutet, der Test funktioniert auch ohne in etwa ähnliche Varianzen der Gruppen. Die Durchführung und Interpretation zeigt dieser Artikel.

Voraussetzungen des Welch-Tests

Die wichtigsten Voraussetzungen sind:

Hinweis: Sind deine Varianzen homogen, rechnest du den einfachen t-Test bei unabhängigen Stichproben.

Dieses Video ansehen auf YouTube.

Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.

Durchführung des Welch-Tests in SPSS

Zunächst ist für jede Gruppe die abhängige Variable auf Normalverteilung zu testen. Das zeigt dieser Artikel. Ist diese Voraussetzung nicht erfüllt, empfiehlt sich der Mann-Whitney-U-Test.

Ist diese Voraussetzung erfüllt, fahrt ihr hier fort:

Über das Menü in SPSS: Analysieren -> Mittelwerte vergleichen -> T-Test für unabhängige Stichproben

Unter Optionen 95% Konfidenzintervall und „Fallausschluss Test für Test“.

Als Gruppierungsvariable ist das die beiden Gruppen trennende Merkmal/Variable auszuwählen und die beiden Gruppen anhand der Merkmalsausprägungen zu definieren. In meinem Beispiel teste ich Pflanzenwachstum in zwei unterschiedlichen Umgebungen. Eine sehr kalte Temperatur und eine normale Temperatur. Dies sind meine zwei Gruppen. Ich möchte mit dem Welch-Test herausfinden, ob sich die Gruppen hinsichtlich des Pflanzenwachstums signifikant voneinander unterscheiden.

Welch-Test

 

Interpretation der Ergebnisse des Welch-Tests in SPSS

Deskriptive Statistiken

Ein erster Eindruck ist anhand der Tabelle der deskriptiven Statistiken erkennbar. Die Mittelwerte des abhängigen Variable (hier: Pflanzenwachstum) unterscheiden sich je nach Temperatur (sehr kalt, normal). Die Standardabweichungen (die Wurzel der Varianz) ist über die zwei Gruppen durchaus verschieden. Ein analytischer Test ist aber dennoch durchzuführen.

 

Varianzhomogenität

Varianzhomogenität wurde im „Levene-Test der Varianzgleichheit“ geprüft. Ist der Wert unter 0,05, wird die Nullhypothese (Homogenität/Gleichheit der Varianzen) verworfen. Die Nullhypothese lautet hierbei, dass die Varianzen homogen sind. 

welch varianzhomogenität

 

Im Beispiel liegt die Signifikanz mit 0,014 unter 0,05. Somit wird die Nullhypothese von Varianzhomogenität verworfen. Demzufolge wird die Alternativhypothese heterogener Varianzen angenommen. Folglich sind die Ergebnisse des t-Tests mit ungleichen Varianzen zu interpretieren.

 

Welch-Test (der t-Test bei ungleichen Varianzen)

Da wir festgestellt haben, dass wir ungleiche Varianzen haben, kümmern wir uns nur um die Zeile „Varianzen sind nicht gleich„.

 

Hier müssen wir uns lediglich um die Spalte „Sig. (2-seitig)“ kümmern. Wir erkennen, dass wir hier eine Signifikanz von 0,000 haben. Diese liegt unter dem typischen Alphafehler von 0,05. Wir verwerfen die Nullhypothese des Welch-Tests von Gleichheit der Mittelwerte der beiden Gruppen. Wir nehmen daher die Alternativhypothese an, dass sich die beiden Gruppen hinsichtlich des Mittelwertes unterscheiden. Es ist auch zu sehen, dass die Mittlere Differenz -13,917 ist. Diese ergibt sich aus dem Wachstum bei sehr kalter Temperatur (21,33) abzüglich des Wachstums bei normaler Temperatur (35,25).

Ein 1-seitiges testen ist möglich. Hierzu wird die Signifikanz schlicht halbiert. Das ändert in dem Falle allerdings nichts am Ergebnis. 

ACHTUNG: Testet man einseitig, ist das im Vorfeld zu benennen.

 

Die Effektstärke – wie stark ist der Unterschied?

Die Effektstärke wird von SPSS nicht ausgegeben, also wie stark sich die beiden Stichproben unterscheiden. Die ist manuell zu berechnen und mit Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 79-81 zu beurteilen. Die Berechnung erfolgt über die Formel mit t² als quadrierter T-Wert und df als degrees of freedom (Freiheitsgrade).

    \[  r = \sqrt{\frac{t^2}{t^2+df}} \]

Ab 0,1 ist es ein schwacher Effekt, ab 0,3 ein mittlerer und ab 0,5 ein starker Effekt.

Im Beispiel ist der t-Wert -11,169 und die Freiheitsgrade (df) 19,842. Eingesetzt in die Formel:

    \[ r = \sqrt{\frac{(-11,169)^2}{(-11,169)^2+19,842}}= 0,929\]

Das Ergebnis von 0,929 liegt über der Grenze zum starken Effekt. Somit ist der Unterschied stark. 

 

Berichten der Ergebnisse des Welch-Tests aus SPSS

Da es nicht viele Werte gibt, ist nicht viel zu berichten:

Das Schema ist folgendes: t(df) = T-Wert, p = Signifikanz

Das sieht im Beispiel so aus, da wir uns in der zweiten Zeile befinden: t(19,842) = -11,169; p = 0,000.

 

Tipp zum Schluss

Findest du die Tabellen von SPSS hässlich? Dann schau dir mal an, wie man mit wenigen Klicks die Tabellen in SPSS im APA-Standard ausgeben lassen kann.