Ziel des Chi-Quadrat-Test in Excel

Der Chi-Quadrat-Test prüft, ob es zwischen erwarteten und beobachteten Häufigkeiten statistisch signifikante Unterschiede gibt. Hierzu verwendet dieser Test die quadrierten Abweichungen der tatsächlichen von den erwarteten Häufigkeiten und teilt sie durch die erwarteten Häufigkeiten. Mit diesem Wissen kann man das in Excel (Dateidownload gibt es auch) recht leicht nachbauen, wie ich euch in diesem Artikel zeige.

Voraussetzungen des Chi-Quadrat-Test in Excel

  • Zwei nominal skalierte Variablen
  • 2 oder mehr Ausprägungen dieser Variablen
Dieses Video ansehen auf YouTube.

Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.

Für eine Berechnung in SPSS, schaut euch diesen Artikel an.

 

Durchführung des Chi-Quadrat-Tests in Excel

Zunächst braucht ihr hierfür eine leere Excel-Tabelle, die ihr folgendermaßen aufbaut:

  • die eine Variable kommt mit ihren Ausprägungen in die Zeilen
  • die andere Variable kommt mit ihren Ausprägungen in die Spalten

In diesem Beispiel soll untersucht werden, ob es einen Unterschied im Abstimmverhalten von Männern und Frauen gibt. Oder anders formuliert: Tendieren Männer eher zu einer Ja-Entscheidung als Frauen. Die Nullhypothese Chi-Quadrat-Tests lautet, dass sich Männer und Frauen in ihren Abstimmverhalten nicht unterscheiden. Für einen Unterschied ist die Nullhypothese also zu verwerfen.  

Beobachtete Häufigkeiten

Bei den beobachteten Häufigkeiten haben wir 60 Männer, die mit Ja gestimmt haben und 40 mit nein. Bei den Frauen gab es 125 Ja-Stimmen und 25 Nein-Stimmen. Es sind insgesamt 185 Ja-Stimmen und 65 Nein-Stimmen, was in einer Tabelle wie folgt aussieht.  

Chi-Quadrat

Beobachtete Häufigkeiten in einer Tabelle

 

Wir erkennen auch, das jeweils Spaltensummen und Zeilensumme gebildet wurden. Insgesamt haben wir 100 Männer und 150 Frauen.  

 

Erwartete Häufigkeiten

Als nächstes benötigen wir nach den beobachteten Häufigkeiten noch die erwarteten Häufigkeiten. Diese zu berechnen funktioniert recht einfach. Zunächst brauchen wir dazu eine neue Tabelle, die lediglich die Spalten und Zeilensummen von oben enthält. 

 

Chi-Quadrat

Erwartete Häufigkeiten in einer Tabelle I

 

Um die erwarteten Häufigkeiten zu berechnen, geht man wie folgt vor. Zuerst berechnen wir die erwarteten Häufigkeiten für Männer mit Ja-Stimmen. Dazu werden die Randhäufigkeiten von Männern (100) und Ja-Stimmen (185) miteinander multipliziert. Die hieraus erhaltenen 18.500 werden nun durch die Gesamtsumme an Beobachtungen (250) geteilt und man erhält eine erwartete Häufigkeit für Männer mit Ja-Stimmen von 74.

Analog geht man für alle anderen Felder vor, also als zweites Beispiel die Frauen mit Nein-Stimmen. Es werden die Randhäufigkeiten von Frauen (150) und Nein-Stimmen (65) miteinander multipliziert. Die erhaltenen 9.750 werden dann durch die Gesamtsumme an Beobachtungen (250) geteilt, was eine erwartete Häufigkeiten von Frauen mit Nein-Stimmen von 39 entspricht. Die Endtabelle sieht wie folgt aus:  

 

Erwartete Häufigkeiten in einer Tabelle II

 

Chi-Quadrat-Test

Da wir nun die beobachteten und erwarteten Häufigkeiten ermittelt haben, können wir den Chi-Quadrat-Test berechnen. Hierzu nutzen wir die CHIQU.TEST-Funktion, die Excel integriert hat. Hierzu gehen wir in eine beliebige leere Zeile und tippen =CHIQU.TEST(Beob_Messwerte;Erwart_Werte) ein. Beob_Messwerte sind im Beispiel die Zellen, die die beobachteten Messwerte enthalten. Ihr müsst lediglich mit der Maus einen Rahmen um sie ziehen. Selbiges macht ihr für Erwart_Werte der letzten Tabelle. CHIQU.TEST gibt euch nun die Wahrscheinlichkeit zurück, dass ein Wert der Chi-Quadrat-Verteilung mit mindestens dem Wert, der das Ergebnis der obigen Formel war, zufällig passiert sein könnte, wenn Unabhängigkeit angenommen wird. Zu Deutsch: ein sehr kleiner Wert von wenigen Prozent ist hier ein wünschenswertes Ergebnis, da es die Wahrscheinlichkeit für einen zufälligen Unterschied darstellt.

 

Interpretation der Ergebnisse des Chi-Quadrat-Test in Excel

Für mein obiges Beispiel kommt ein Chi-Quadrat-Wert von 3,78052E-05 heraus. Das sind 0,0000378052, was deutlich unter der typischen Fehlerwahrscheinlichkeit von 0,05 liegt. Ich konnte also mit dem Chi-Quadrat-Test für mein Beispiel zeigen, dass Männer und Frauen hinsichtlich ihres Abstimmverhaltens nicht unabhängig sind. Das heißt, Männer und Frauen unterscheiden sich in ihrem Abstimmverhalten.

Ist euer Wert auf Basis der CHIQU.TEST-Funktion unter der typischen Fehlerwahrscheinlichkeit von 5% (=0,05) könnt ihr von einer hinreichend niedrigen Zufallswahrscheinlichkeit ausgehen und ihr konnten damit die Nullhypothese von Unabhängigkeit verwerfen.

Hinweis: Ist die beobachtet Häufigkeit in einer Zelle der oberen Kreuztabelle 5 oder kleiner, ist der exakte Test nach Fisher zu rechnen und zu interpretieren. Dies lässt sich allerdings nur in SPSS praktikabel machen, was ich in diesem Artikel zeige.

 

Ermittlung der Effektstärke des Chi-Quadrat-Tests für eine 2×2-Kreuztabelle

Die Effektstärke Phi bzw. w wird bei einer 2×2-Kreuztabelle mit folgender Formel berechnet. Der Chi-Quadrat-Wert (Standardteststatistik) wird durch die Stichprobengröße geteilt und hieraus anschließend die Wurzel gezogen. Eine Effektstärke kann man sinnvollerweise allerdings nur für statistisch signifikante Unterschiede berechnen. Wie erhält man den Chi-Quadrat-Wert? Man nutzt in Excel die Funktion =CHIQU.INV.RE(Wahrsch;Freiheitsgrade). Die Wahrscheinlichkeit ist die oben ermittelte von 0,0000378052, Freiheitsgrade ist stets 1. Der Chi-Quadrat-Wert wird durch die Gesamtzahl an Beobachtungen (250) geteilt und daraus die Wurzel gezogen und beträgt 16,978517.

Im Beispiel ist der Chi-Quadrat-Wert 16,978517 und N 250. Das Ergebnis ist w=0,2606 und ist ein schwacher Effekt.

Zwischen 0,1 und 0,3 ist es ein schwacher Effekt, zwischen 0,3 und 0,5 ein mittlerer Effekt und ab 0,5 ist es ein starker Effekt. Quelle: Cohen, Jacob (1988): Statistical Power Analysis for the Behavioral Sciences.  

 

Ermittlung der Effektstärke des Chi-Quadrat-Tests für eine beliebige Kreuztabelle

Solltet ihr eine Kreuztabelle haben, die mehr als 2 Spalten und Zeilen hat, empfehle ich euch das SPSS-Video auf meinem YouTube-Kanal, da die Menge an Formeln zu einem zu langen Artikel führen würde.

Dieses Video ansehen auf YouTube.

 

Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.