t-Test für unabhängige Stichproben in datatab rechnen

von | Mai 1, 2020 | Mittelwertvergleich, t-Test


Dieser Blogbeitrag zeigt, wie man bei datatab einen t-Test für unabhängige Stichproben rechnet – mit Datatab direkt im Browser und ohne Plugins!

Ihr geht hierfür auf https://datatab.de/statistik-rechner/hypothesentest und haltet eure Daten bereit. Zunächst müsst ihr sie evtl. noch kurz vorbereiten.

 

Die Daten vorbereiten

Bevor es ans Rechnen gehen kann, braucht Datatab natürlich die zu analysierenden Daten. Am einfachsten funktioniert es mit Daten aus Excel, die ihr kopiert. Aber auch .csv-Dateien kann man ohne Probleme einfügen. Einfach in Excel öffnen und kopieren.

Als erstes leert man die bereits existierende Tabelle mit Beispieldaten und kopiert die eigenen hinein. Ich habe für den t-Test Probanden mit ihrem BMI eingefügt. Zusätzlich ist das Geschlecht der Probanden mit erfasst wurden. Die Frage, die ich mit t-Test zu beantworten versuche ist, ob Männer einen höheren BMI haben als Frauen.

Meine Hypothese lautet: Männer haben einen höheren BMI als Frauen.

 

Nach dem Einfügen der Daten sind noch die Variablen und ihre Skalierung anzupassen. Hierzu geht man auf „Variablen-Ansicht“.

 

Das Geschlecht ist offensichtlich kategorial skaliert. Kategorial ist synonym für nominal. Demzufolge ist Nominal als Skalenniveau zu wählen. Zusätzlich können Labels und Werte für die Variable Geschlecht festgelegt werden. Männer sind in meinem Datensatz mit 0 codiert, Frauen mit 1. Der BMI ist offensichtlich metrisch skaliert, was auch als skalar bezeichnet wird.

Im Reiter Settings können zusätzlich „fehlende Werte“ definiert werden, das Dezimalzeichen (Komma oder Punkt) und die Anzahl an Nachkommastellen eingestellt werden. Sollten Variablen mit Semikolon (z.B. 0;5;12 ) getrennt sein, funktioniert dies auch mit der Angabe bei „Seperator der Daten“. Das Semikolon ist allerdings schon voreingestellt, sollten als Bindestriche oder Doppelpunkte verwendet werden, kann man diese hier eintragen.

 

Durchführung des t-Tests

Auswahl des t-Tests und deskriptive Statistiken

Unter der Datentabelle ist nun „t Test“ auszuwählen:

 

Als nächstes sind die Variablen und deren Rolle im t-Test auszuwählen. BMI und Geschlecht sind die einzigen Variablen im Datensatz. Datatab erkennt automatisch, dass Geschlecht nur binär ist und deswegen nur ein t-Test in Frage kommt, wenn die abhängige Variable (Testvariable) metrisch/skalar ist:

Als nächstes kann noch zwischen parametrischem und nicht-parametrischem Test unterschieden werden. Der t-Test ist ein parametrischer Test und bereits vorselektiert. Der nicht-parametrische Test wird dann ausgewählt, wenn die Testvariable pro Gruppe nicht normalverteilt sind. Das wäre dann der Mann-Whitney-U-Test. Hier wird aber der t-Test gerechnet. Die Signifikanz, also die Wahrscheinlichkeit die Nullhypothese zugunsten der Alternativhypothese fälschlicherweise anzunehmen, ist standardmäßig auf 0,05 (= 5%) festgelegt.

Die deskriptive Statistik wird mit der Anzahl (N), dem Mittelwert, der Standardabweichung und dem Standardfehler des Mittelwertes beschrieben. Diese sind auch am Ende der Analyse – vielleicht bald auch etwas weiter oben – mit einem Boxplot veranschaulicht. Ich liebe Boxplots und hier kann ich erahnen, dass die Lage- und Streumaße ebenfalls auf einen höheren BMI bei Männern (linker Boxplot) hindeuten. Ein kleines Tutorial zum Interpretieren von Boxplots kann dir hier zusätzlich helfen.

Man kann bereits erkennen, dass der Mittelwert des BMI bei den Männern etwas höher ist. Ist er aber signifikant, also „systematisch“ höher? Dazu folgt der t-Test.

 

Varianzgleichheit prüfen

Vorher ist aber noch zu prüfen, welche Zeile des t-Tests wir interpretieren müssen.Das hängt von der Varianzgleichheit ab. Sind die Varianzen gleich oder nicht bzw. ähnlich genug? Das beantwortet der Levene-Test: Die Nullhypothese des Levene-Test geht von Varianzgleichheit aus. Sie kann in diesem Fall aufgrund der Signfikanz über 0,05 nicht verworfen werden. Die Signifikanz ist mit 0,088 zu hoch. Es liegt also Varianzgleichheit vor.

 

Ergebnisse des t-Tests interpretieren

Nun kann man aber endlich an die Auswertung gehen. Wir haben festgestellt, dass bei den Gruppen halbwegs gleich sind. Demzufolge interessiert nur die erste Zeile des t-Tests. Sind die Varianzen nicht gleich, wird die zweite Zeile interpretiert (der sog. Welch-Test). Hier ist ein Blick auf die „Mittelwertdifferenz“ hilfreich, um ein Gefühl zu bekommen. Der Mittelwert der zweiten Gruppe (Frauen) wird vom Mittelwert der ersten Gruppe (Männer) abgezogen. Das bedeutet, dass der Mittelwert der Männer um 1,503 größer ist als der Mittelwert der Frauen. Ist dieser Unterschied aber signifikant? Ein Blick auf Sig. (2-seitig) zeigt 0,11.

Da ich eine gerichtete Hypothese habe (Männer haben einen höheren BMI als Frauen), und der mittlere BMI der Männer tatsächlich höher ist, darf ich einseitig testen. Hierzu wird die Signifikanz einfach halbiert. Die 1-seitige Signifikanz ist demnach 0,055. Diese Signifikanz liegt allerdings immer noch über dem typischen Alpha-Fehler, die unter „Statistische Signifikanz“ weiter oben festgelegt wurde.

 

Man würde an dieser Stelle also schließen, dass in der vorliegenden Stichprobe der BMI der Männer nicht statistisch signifikant höher ist als der Frauen. Die eingangs aufgestellte Hypothese konnte somit nicht bekräftigt werden – und dank Datatab alles im Browser, ohne SPSS, Excel oder dergleichen.

 

 

Hat dir der Beitrag geholfen?

Dann würde ich mich über eine kleine Spende freuen, die es mir erlaubt, weiterhin kostenfreie Inhalte zu veröffentlichen.

Vielen Dank und viel Erfolg!

Über mich

Björn Walther

Excel- und SPSS-Experte

YouTube-Kanal

Excel Online-Kurs

YouTube-Kanal