T-Test bei unabhängigen Stichproben in Excel durchführen

von | Zuletzt bearbeitet am: Dec 12, 2022 | Excel, Mittelwertvergleich, t-Test

1 Ziel des t-Test bei unabhängigen Stichproben in Excel

Der t-Test für unabhängige Stichproben in Excel testet, ob bei zwei unabhängigen Stichproben die Mittelwerte bzw. zentralen Tendenzen unterschiedlich sind. Für abhängige Stichproben ist der t-Test für verbundene Stichproben zu rechnen. In SPSS gibt es den t-Test für unabhängige Stichproben auch. Habt ihr nur eine Stichprobe, rechnet ihr den Einstichproben t-Test.

2 Voraussetzungen des t-Test bei unabhängigen Stichproben in Excel

Die wichtigsten Voraussetzungen sind:

  • zwei voneinander unabhängige Stichproben/Gruppen
  • metrisch skalierte y-Variable
  • normalverteilte Fehlerterme innerhalb der Gruppen
  • Homogene (nahezu gleiche) Varianzen der y-Variablen der Gruppen – über Levene-Test
  • Achtung: Mindeststichprobengröße bedenken – über eine Poweranalyse zu ermitteln

Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.

 

3 Durchführung des t-Test bei unabhängigen Stichproben in Excel

Über das Menü in Excel: Reiter “Daten” -> “Datenanalyse” -> “Zweistichproben t-Test: Gleicher Varianzen”.

t-test excel

Hinweis: Sollte die Funktion “Datenanalyse” nicht vorhanden sein, ist diese über “Datei” -> “Optionen” -> “Add-Ins” -> “Verwalten” -> “Los…” zu aktivieren. Dieses Video zeigt dies kurz.

Als Bereich Variable A markiert man die beobachteten Werte der ersten Stichprobe. Im Bereich Variable B sind es entsprechend die beobachteten Werte der zweiten Stichprobe. Unten ist zu sehen, dass B3-B15 die eine Variable bzw. Gruppe und E3-E15 die andere Gruppe bzw. Variable ist.

Bei “Hypothetische Differenz der Mittelwerte” ist eine “0” einzutragen Dies hat zur Folge, dass Excel folgende Nullhypothese testet: die beiden Stichproben stammen aus der gleichen Grundgesamtheit und besitzen damit ähnliche (“gleiche”) Mittelwerte.

Sollte in den Bereichen A und B eine Beschriftung mit markiert worden sein, ist bei “Beschriftungen” ein Haken zu setzen. Dadurch wird die erste Zeile, die dann die Beschriftung enthält, ignoriert.

t-test excel

 

Als Alpha ist das Alphafehler-Niveau einzutragen. Hier ist typischerweise 5% also 0,05 zu wählen. Es besteht auch die Möglichkeit eine geringere Wahrscheinlichkeit einen Fehler 1. Art  zu wählen. Das entspricht einer geringeren Wahrscheinlichkeit, die Nullhypothese fälschlicherweise abzulehnen.

 

4 Interpretation des t-Test bei unabhängigen Stichproben in Excel

4.1 Die Voraussetzung der Varianzhomogenität

Sie kann auf zwei Arten geprüft werden. Zum einen mit der Berechnung der Varianz der Stichproben. Wenn sie ungefähr gleich sind, genügt dies. Zum anderen kann ein analytischer Test gerechnet werden: der Levene-Test (Video). Häufig reicht die erste Variante bereits. Sind die Varianzen nicht homogen bzw. gleich, muss ein t-Test mit unterschiedlichen Varianzen gerechnet werden. Die Auswahl ist im Menü analog zu oben: Reiter “Daten” -> “Datenanalyse” -> “Zweistichproben t-Test: Unterschiedlicher Varianzen”.

Ausgabe des Zweistichproben t-Test unter der Annahme gleicher Varianzen

t-test excel

 

4.2 Signifikanz des Tests

Neben den standardmäßig ausgegebenen Mittelwert, Varianzen, Beobachtungen usw. ist das Augenmerk auf den p-Wert (“P(T<=t) einseitig” bzw. “P(T<=t) zweiseitig”) zu richten. ACHTUNG: Hat man bereits eine Vermutung, dass z.B. eine Gruppe einen höheren/niedrigeren Wert hat, ist dies eine gerichtete Hypothese und man muss 1-seitig testen – sofern die Mittelwerte Anlass dazu geben und die Vermutung widerspiegeln. Demzufolge interessiert nur der Wert hinter “P(T<=t) einseitig” und jener wird auf Signifikanz getestet. Ist er kleiner als Alpha (z.B. 0,05), geht man davon aus, dass die Stichproben nicht aus der selben Grundgesamtheit stammen. Hier: 0,018. Oder etwas salopper formuliert: man kann von statistisch signifikanten Unterschieden hinsichtlich der Mittelwerte zwischen den Stichproben ausgehen.

 

Alternativ kann man statt dem p-Wert auch die sog. “t-Statistik” (hier 2,231) zur Beurteilung heranziehen. Sie ist mit dem “Kritischer t-Wert bei einseitigem t-Test” bzw. “Kritischer t-Wert bei zweiseitigem t-Test” zu vergleichen. Ist der kritische t-Wert kleiner als die t-Statistik , ist die Nullhypothese von Gleichheit ebenfalls zu verwerfen. Ob einseitig oder zweiseitig zu testen ist, ist analog zu 3. zu entscheiden.

 

4.3 Effektstärke des Tests

 

4.3.1 Cohen’s d manuell berechnen

    \[  d = \frac{\bar{x_{1}}-\bar{x_{2}}}{s}} \]

 

mit


    \[s = \sqrt{\frac{(n_{1}-1)\cdot s_{1}^{2} + (n_{2}-1)\cdot s_{2}^{2}} {n_{1}+n_{2}-2}} \]

bzw. bei gleichen Gruppengrößen

    \[s = \sqrt{\frac{s_{1}^{2}- s_{2}^{2}}{2}} \]

Im Beispiel sind die Mittelwerte 61 und 52,38 (siehe oben) sowie die gepoolte Standardabweichung 9,85. Eingesetzt in die obige Formel:

    \[ d = \frac{61-52,38}{9,85}} = 0,875 \]

Diese Größe wird nun eingeordnet. Laut Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 25-26 ist ein Effekt:
  • ab 0,2 klein,
  • ab 0,5 mittel und
  • ab 0,8 stark.
Im Beispiel liegt der Wert 0,875 über der Grenze zum starken Effekt. Somit ist der Unterschied zwischen den beiden Gruppen bzw. deren Ruhepulsen stark.
ACHTUNG: Je nach Disziplin können andere Grenzen gelten. Dies ist im Vorfeld zu prüfen.

 

4.3.2 Effektstärkemaß r manuell berechnen

Eine zweite Möglichkeit ist die manuelle Berechnung von r sowie die Beurteilung anhand Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 79-81. Cohen selbst merkt aber an, dass die Effektstärkemaße und deren Klassengrenzen nicht 1:1 vergleichbar sind. Vorzuziehen ist Cohen’s d. Die Berechnung von r erfolgt über die Formel mit t² als quadrierter T-Wert und df als degrees of freedom (Freiheitsgrade).

    \[  r = \sqrt{\frac{t^2}{t^2+df}} \]

Ab 0,1 ist es ein schwacher Effekt, ab 0,3 ein mittlerer und ab 0,5 ein starker Effekt.

Im Beispiel ist der t-Wert 2,231 und die Freiheitsgrade (df) 24. Eingesetzt in die Formel:

    \[ r = \sqrt{\frac{2,231^2}{2,231^2+24}}= 0,414 \]

Das Ergebnis von 0,414 liegt über der Grenze zur mittleren Effektstärke und der Unterschied ist damit lauut Cohen ein mittelstarker Unterschied. Allerdings gibt es neuere Richtlinien bzgl. r, die von Gignac, Szodorai (2016) vorgeschlagen wurden, die bei 0,1 (klein), 0,2 (mittel) und 0,3 (groß) liegen. Demnach wäre der Unterschied im Beispiel ein großer.

 

5 Videotutorials

 

6 Reporting des t-Tests bei unabhängigen Stichproben

Gruppenmittelwerte und Standardabweichungen sind zu berichten. Zusätzlich die t-Statistik mit Freiheitsgraden, der p-Wert und die Effektstärke (Cohens d bzw. Hedges’ Korrektur): t(df)=t-Wert; p-Wert; Effektstärke.

 

Untrainierte Probanden (M = 61; SD = 9,82) haben gegenüber trainierten Probanden (M = 52,38; SD = 9,87) einen signifikant höheren Ruhepuls, t(24) = 2,23; p = 0,035; d = 0,88. Nach Cohen (1992) ist dieser Unterschied groß.

 

7 Literatur

  • Cohen, J. (1988). Statistical power analysis for the behavioral sciences. New York, NY: Psychology Press, Taylor & Francis Group
  • Cohen, J. (1992). A power primer. Psychological bulletin, 112(1), 155-159.
  • Gignac, G. E., & Szodorai, E. T. (2016). Effect size guidelines for individual differences researchers. Personality and individual differences, 102, 74-78.

 

Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.

 

Hilfreiche Artikel für’s Arbeiten in Excel:

Hat dir der Beitrag geholfen?

Dann würde ich mich über eine kleine Spende freuen, die es mir erlaubt, weiterhin kostenfreie Inhalte zu veröffentlichen.
Alternativ kannst du über meinen Amazon Affiliate-Link einkaufen – ohne Zusatzkosten.

Vielen Dank und viel Erfolg!

Über mich

Björn Walther

Ein 💚 für Statistik & Datenanalyse

Excel Online-Kurs

YouTube-Kanal

Inhalt