t-Test für unabhängige Stichproben in R rechnen und interpretieren

von | Mai 20, 2020 | R, t-Test

Ziel des t-Test bei unabhängigen Stichproben in R

Der t-Test für unabhängige Stichproben testet, ob für zwei unverbundene (unabhängige) Stichproben die unterschiedliche Mittelwerte bzgl. einer abhängigen Testvariable existieren. Für abhängige Stichproben ist der t-Test für verbundene Stichproben zu rechnen. In Excel und SPSS kann der t-Test für unabhängige Stichproben auch gerechnet werden.

Sind die folgenden Voraussetzungen nicht erfüllt, solltet ihr einen Mann-Whitney-U-Test rechnen.

Voraussetzungen des t-Test bei unabhängigen Stichproben in R

Die wichtigsten Voraussetzungen sind:

  • zwei voneinander unabhängige Stichproben/Gruppen
  • metrisch skalierte y-Variable
  • normalverteilte y-Variable innerhalb der Gruppen
  • Homogene (nahezu gleiche) Varianzen der y-Variablen der Gruppen (Levene-Test über die Ausgabe beim Durchführen des t-Test)
Dieses Video ansehen auf YouTube.

Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.  

Durchführung des t-Test bei unabhängigen Stichproben in R

Nullhypothese

Die Nullhyopthese beim t-Test für unabhängige Stichproben geht von in etwa Gleichheit der Mittelwerte der beiden Gruppen aus.

Ihr könnt bei diesem Test einseitig und zweiseitig testen. Einseitig heißt lediglich, dass ihr eine konkrete Vermutung habt, dass der Mittelwert der Testvariable (=abhängige Variable) der einen Gruppe kleiner oder größer ist als der Mittelwert der Testvariable der anderen Gruppe. Standardmäßig wird zweiseitig getestet, das heißt ihr vermutet einen Unterschied, wisst aber nicht, ob welche Gruppen den größeren Mittelwert hat. Ein Beispiel: Ich habe einen Datensatz mit Männern und Frauen und ich möchte schauen, ob sie sich im Mittel hinsichtlich ihrer Körpergröße (in m) unterscheiden. Die Nullhypothese ist also: Es gibt keinen Unterschied hinsichtlich der Körpergröße (in m) zwischen Männern und Frauen. Die Alternativhypothese lautet entsprechend: Es gibt einen Unterschied hinsichtlich der Körpergröße (in m) zwischen Männern und Frauen. Das können wir sogar konkretisieren, da wir aus Erfahrung wissen, dass Männer etwas größer (Frauen: 1,66 m, Männer: 1,79 m) sind. Die Alternativhypothese kann demzufolge sogar lauten: Männer haben im Mittel eine größere Körpergröße (in m).  

 

t-Statistik

Die Berechnung der T-Statistik ist die Basis, die folgende Formel hat:

    \[ T=\frac{\bar{X}-\bar{Y}-{\omega_0 }}{s}\cdot \sqrt{\frac{nm}{n+m}} \]

Zum Glück muss man das in R nicht alles nachbauen und kann direkt die Funktion t.test() verwenden.  

 

Code in R

Nach dem Einlesen eurer Daten verwendet ihr die Funktion t.test():

t.test(x~y, var.equal, alternative)

Die Funktion t.test() hat noch viele weitere Attribute, die drei obigen sind aber die wichtigsten. $x$ ist eure Testvariable, $y$ die Gruppenvariable. Bei mir ist $x$ die Körpergröße und $y$ das Geschlecht. $var.equal$ gibt an, ob ihr gleiche oder ungleiche Varianzen habt. Das solltet ihr im Vorfeld testen. Meist reicht ein Augentest mit z.B. der „describeBy“-Funktion des „psych“-Pakets. „alternative“ gibt an, ob ein- oder zweiseitig getestet wird. Einseitig bedeutet, ihr wisst, welche Gruppe einen größeren oder kleineren Wert hat, also es existiert eine konkrete Wirkungsvermutung. Wir können hier einseitig testen, ich zeige aber sowohl einen einseitigen als auch einen zweiseitigen Test.  

 

Beispielcode in R &#8211 zweiseitiger Test

t.test(Größe~Geschlecht, var.equal = TRUE, alternative = “two.sided“)

Wie zu erkennen ist, habe ich die Größe auf Unterschied hinsichtlich des Geschlechts geprüft („Größe~Geschlecht“). Gleichzeitig habe ich im Vorfeld schon geprüft, ob ich gleiche Varianzen habe. Demzufolge verwende ich auch „var.equal = TRUE“. Sollte ihr ungleiche Varianzen haben, gebt ihr statt TURE einfach FALSE an, dann wird ein Welch-Test gerechnet. Als „alternative“ habe ich „two.sided“ angegeben. Das ist die typische Testung, die standardmäßig von t.test() vorgenommen wird – man kann dieses Argument daher auch hier weglassen.  

 

Beispielcode in R &#8211 einseitiger Test

Habt ihr eine konkrete Vermutung, welche Gruppen einen größeren Mittelwert hat, testet ihr einseitig. Dazu fügt ihr dem Code noch das Argument “ alternative = “greater“ “ oder  “ alternative = “less“ “ hinzu. Hierbei ist zu beachten, dass greater bedeutet, dass eure Gruppe 1 größer ist als Gruppe 2. Was ist Gruppe 1 und was ist Gruppe 2? Das habt ihr im Vorfeld im Datensatz festgelegt. In meinem Fall hat die Geschlechtsvariable die Ausprägung 0 für Männer und 1 für Frauen. Die Gruppe 1 im t-Test ist also immer die Gruppe, deren Gruppierungscodierung kleiner ist. Bei mir die Männer.

t.test(Größe~Geschlecht, var.equal = TRUE, alternative = “greater“)

Wenn ihr jedoch (aus welchen Gründe auch immer) davon ausgeht, dass die Männer im Mittel kleiner sind als die Frauen, lautet das Argument “ alternative = “less“ „.

t.test(Größe~Geschlecht, var.equal = TRUE, alternative = “less“)

 

 

Interpretation der Ergebnisse des Einstichproben t-Test in R

Interpretation des zweiseitigen t-Tests

Two Sample t-test data: Größe by Geschlecht

t = 3.9402, df = 49, p-value = 0.0002581

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval: 0.06332773 0.19516458

sample estimates:

mean in group 0: 1.778846

mean in group 1 : 1.649600

Aus diesem Wust an Zahlen interessiert an und für sich nur sehr weniges.

  • Zunächst stehen ganz unten die Gruppenmittelwert. Für Gruppe 0: 1,778846 und für Gruppe 1: 1,649600.
  • Diese beiden Mittelwerte werden gegeneinander getestet.
  • Der p-Wert ist mit 0,0002571 unter dem typischen Alphafehler von 0,05. Man verwirft also die Nullhypothese von Gleichheit der Gruppenmittelwerte. Die Alternativhypothese „true difference in means is not equal to 0“ wird angenommen. Auf deutsch: Die Mittelwertdifferenz ist ungleich 0. Demzufolge gehen wir von statistisch signifikanten Unterschieden hinsichtlich der Körpergröße bei Männern und Frauen aus.
  • Berichtet man die Ergebnisse, gibt man zusätzlich zum p-Wert und den Mittelwerten noch die t-Statistik (3,9402) sowie die Freiheitsgrade (df=49) zusätzlich zum p-Wert an.

 

Interpretation des einseitigen t-Tests

Hier wurde nun der t-Test für verbundene Stichproben einseitig gerechnet. Und zwar war die Vermutung, dass die Männer im Mittel größer sind.

Two Sample t-test data: Größe by Geschlecht

t = 3.9402, df = 49, p-value = 0.000129

alternative hypothesis: true difference in means is greater than 0

95 percent confidence interval: 0.07425165 Inf

sample estimates:

mean in group 0: 1.778846

mean in group 1 : 1.649600

 

Der einseitige t-Test ist nahezu analog zum zweiseitigen t-Test zu interpretieren:

  • Erneut steht ganz unten die Gruppenmittelwerte. Für Gruppe 0: 1,778846 und für Gruppe 1: 1,649600.
  • Nun wird getestet, ob der Mittelwert von Gruppe 0 größer als der von Gruppe 1 ist
  • Der p-Wert ist mit 0,000129 unter dem typischen Alphafehler von 0,05. Man verwirft also die Nullhypothese von Gleichheit der Mittelwerte zugunsten eines größeren Mittelwertes bei den Männern. Die Alternativhypothese „true difference in means is greater than 0“ wird angenommen. Hierbei wird von dem Gruppenmittelwert 0 der Gruppenmittelwert 1 gedanklich abgezogen.  Mit 0,129246 und dem sehr kleinen p-Wert wird diese Alternativhypothese angenommen.
  • Der p-Wert beim einseitigen Test ist stets halb so groß wie beim zweiseitigen Test – vorausgesetzt man hat die korrekte Alternativhypothese (greater, less) formuliert.
  • Berichtet man die Ergebnisse, gibt man zusätzlich zum p-Wert noch die Mittelwerte, die t-Statistik (3,9402) sowie die Freiheitsgrade (df=49) zusätzlich zum p-Wert an.

 

  Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.

 

Hat dir der Beitrag geholfen?

Dann würde ich mich über eine kleine Spende freuen, die es mir erlaubt, weiterhin kostenfreie Inhalte zu veröffentlichen.

Vielen Dank und viel Erfolg!

Über mich

Björn Walther

Excel- und SPSS-Experte

YouTube-Kanal

Excel Online-Kurs

YouTube-Kanal