Chi-Quadrat (Chi²)-Test in Excel rechnen

von | Zuletzt bearbeitet am: Mar 10, 2024 | Chi-Quadrat, Excel

1 Ziel des Chi-Quadrat-Test (Chi-Quadrat-Unabhängigkeitstest) in Excel

Der Chi-Quadrat-Unabhängigkeitstest prüft, zwei Variablen auf Unabhängigkeit. Hierzu wird getestet, ob es zwischen erwarteten und beobachteten Häufigkeiten statistisch “signifikante” Unterschiede gibt. Hierzu verwendet dieser Test die quadrierten Abweichungen der tatsächlichen von den erwarteten Häufigkeiten und teilt sie durch die erwarteten Häufigkeiten. Mit diesem Wissen kann man das in Excel (Dateidownload gibt es auch) recht leicht nachbauen, wie ich euch in diesem Artikel zeige.

Für eine Berechnung in SPSS, schaut euch diesen Artikel an. In R hilft euch dieser Artikel.

 

2 Voraussetzungen des Chi-Quadrat-Unabhängigkeitstests in Excel

 

3 Durchführung des Chi-Quadrat-Unabhängigkeitstests in Excel

Zunächst braucht ihr hierfür eine leere Excel-Tabelle, die ihr folgendermaßen aufbaut:

  • die eine Variable kommt mit ihren Ausprägungen in die Zeilen
  • die andere Variable kommt mit ihren Ausprägungen in die Spalten

In diesem Beispiel soll untersucht werden, ob es einen Unterschied im Abstimmverhalten von Männern und Frauen gibt. Oder anders formuliert: Tendieren Männer eher zu einer Ja-Entscheidung als Frauen oder umgekehrt. Die Nullhypothese des Chi-Quadrat-Tests lautet allgemein, dass die beiden Merkmale unabhängig voneinander sind.

Auf das Beispiel des Abstimmverhaltens würde die Nullhypothese lauten: Männer und Frauen unterscheiden sich in ihren Abstimmverhalten nicht. Für das Beobachten eines Unterschiedes ist die Nullhypothese also zu verwerfen.  

 

3.1 Beobachtete Häufigkeiten

Beobachtete Häufigkeiten bedeutet, dass für die Merkmalskombinationen gezählt wird, wie oft jene im Datensatz vorkommen.
Z.B.: 60 Männer, die mit Ja gestimmt haben und 40 mit Nein. Bei den Frauen gab es 125 Ja-Stimmen und 25 Nein-Stimmen, was in einer Tabelle wie folgt aussieht. 

Chi-Quadrat

Beobachtete Häufigkeiten in einer Tabelle

 

Wir erkennen auch, dass jeweils Spaltensumme und Zeilensumme gebildet wurden. Insgesamt haben wir 100 Männer und 150 Frauen sowie 185 Ja-Stimmen und 65 Nein-Stimmen.

 

3.2 Erwartete Häufigkeiten

Als Nächstes benötigen wir nach den beobachteten Häufigkeiten noch die erwarteten Häufigkeiten. Diese zu berechnen, funktioniert recht einfach. Zunächst brauchen wir dazu eine neue Tabelle, die lediglich die Spaltensumme und Zeilensumme von den beobachteten Häufigkeiten enthält. 

 

Chi-Quadrat

Erwartete Häufigkeiten in einer Tabelle I

 

Um die erwarteten Häufigkeiten zu berechnen, geht man wie folgt vor. Zuerst berechnen wir die erwarteten Häufigkeiten für Männer mit Ja-Stimmen. Dazu werden die Randhäufigkeiten von Männern (100) und Ja-Stimmen (185) miteinander multipliziert. Die hieraus erhaltenen 18.500 werden nun durch die Gesamtsumme an Beobachtungen (250) geteilt und man erhält eine erwartete Häufigkeit für Männer mit Ja-Stimmen von 74.

Analog geht man für alle anderen Felder vor, also als zweites Beispiel die Frauen mit Nein-Stimmen. Es werden die Randhäufigkeiten von Frauen (150) und Nein-Stimmen (65) miteinander multipliziert. Die erhaltenen 9.750 werden dann durch die Gesamtsumme an Beobachtungen (250) geteilt, was eine erwartete Häufigkeit von Frauen mit Nein-Stimmen von 39 entspricht.

Für alle Zellen lauten die Berechnungen:

    \[ H_{M,Ja}=\frac{100\cdot 185}{250}=74 \]

    \[ H_{M,Nein}=\frac{100\cdot 65}{250}=26 \]

    \[ H_{F,Ja}=\frac{185\cdot 150}{250}=111 \]

    \[ H_{F,Nein}=\frac{65\cdot 150}{250}=39 \]

 

Die Endtabelle sieht wie folgt aus:  

 

Erwartete Häufigkeiten in einer Tabelle II

 

3.3 Chi-Quadrat-Test

Da wir nun die beobachteten und erwarteten Häufigkeiten ermittelt haben, können wir den Chi-Quadrat-Test berechnen.

Hierzu nutzen wir die CHIQU.TEST()-Funktion, die Excel integriert hat. Hierzu gehen wir in eine beliebige leere Zeile und tippen =CHIQU.TEST(Beob_Messwerte;Erwart_Werte) ein.
Chi-Quadrat-Unabhängigkeitstest Excel

  • Beob_Messwerte sind im Beispiel die Zellen, die die beobachteten Messwerte enthalten. Ihr müsst lediglich mit der Maus einen Rahmen um sie ziehen. Im Beispiel die Tabelle von D3 – E4
  • Selbiges macht ihr für Erwart_Werte der letzten Tabelle. Im Beispiel die Tabelle von D11 – E12
  • CHIQU.TEST gibt euch jetzt die Wahrscheinlichkeit zurück, dass ein Wert der Chi-Quadrat-Verteilung mit mindestens dem Wert, der das Ergebnis der obigen Formel war, zufällig passiert sein könnte, wenn Unabhängigkeit angenommen wird. Zu Deutsch: ein sehr kleiner p-Wert ist hier ein wünschenswertes Ergebnis, da es einer geringen Zufallswahrscheinlichkeit entspricht.
  • Im Beispiel sehen wir das Formelergebnis schon unten links: p = 3,78052E-05.

    Das entspricht p = 0,0000378052 und ist hinreichend klein, worauf ich in der Interpretation entsprechend eingehe.

 

4 Interpretation der Ergebnisse Chi-Quadrat-Unabhängigkeitstests in Excel

Wie bereits beschrieben, kommt für mein obiges Beispiel ein p = 0,0000378052 von heraus. Das ist deutlich unter der typischen Alphafehlerwahrscheinlichkeit von 0,05. Ich konnte also mit dem Chi-Quadrat-Test für mein Beispiel beobachten, dass Männer und Frauen hinsichtlich ihres Abstimmverhaltens nicht unabhängig sind. Das heißt, Männer und Frauen unterscheiden sich in ihrem Abstimmverhalten.

Ist euer Wert auf Basis der CHIQU.TEST()-Funktion unter der typischen Fehlerwahrscheinlichkeit von 5% (=0,05) könnt ihr von einer hinreichend niedrigen Zufallswahrscheinlichkeit ausgehen und ihr könnt damit die Nullhypothese von Unabhängigkeit verwerfen.

Hinweis: Ist die beobachtete Häufigkeit in einer Zelle der oberen Kreuztabelle 5 oder kleiner, ist der exakte Test nach Fisher zu rechnen und zu interpretieren. Das ist deswegen zu tun, weil der p-Wert nur für hinreichend große Stichproben über die Chi-Quadrat-Verteilung approximativ hinreichend genau geschätzt werden kann. Der Fisher-Test lässt sich allerdings in Excel nicht praktikabel umsetzen. Dazu empfehle ich SPSS oder R.

 

5 Ermittlung der Effektstärke des Chi-Quadrat-Unabhängigkeitstests für eine 2×2-Kreuztabelle

Die Effektstärke Phi bzw. ω (= Omega) wird bei einer 2×2-Kreuztabelle mit folgender Formel berechnet:

Der Chi-Quadrat-Wert (Standardteststatistik) wird durch die Stichprobengröße geteilt und hieraus anschließend die Wurzel gezogen:

    \[ \phi = \omega  =\sqrt{\frac{\chi^2{ }}{N}} \]

Wie erhält man aber den Chi-Quadrat-Wert, wenn man nur einen p-Wert hat? Man nutzt in Excel die Funktion =CHIQU.INV.RE(Wahrsch;Freiheitsgrade). Die Wahrscheinlichkeit ist die oben ermittelte von 0,0000378052, die Freiheitsgrade hierfür sind stets 1.

Dies ergibt einen Chi-Quadrat-Wert von 16,97851557.

Der Chi-Quadrat-Wert (16,978517 wird durch die Gesamtzahl an Beobachtungen (250) geteilt und daraus die Wurzel gezogen.

    \[ \phi = \omega  =\sqrt{\frac{16,97851557}{250}}=0,2606 \]

Das Ergebnis ist ω = 0,2606.

Zur Einordnung von ω werden zuerst vergleichbare Studien herangezogen. Sollten diese nicht existieren, können fachspezifische Grenzen zur Einordnung genutzt werden. Sollten auch diese nicht existieren, können die von Cohen (1992), S. 157 für die Sozial- und Verhaltenswissenschaften aufgestellten Grenzen für ω verwendet werden: 0,1; 0,3 und 0,5 für kleine, mittlere und größe Effekte.

 

6 Ermittlung der Effektstärke des Chi-Quadrat-Unabhängigkeitstests für eine beliebige Kreuztabelle

Solltet ihr eine Kreuztabelle haben, die mehr als 2 Spalten und Zeilen hat, empfehle ich euch das SPSS-Video auf meinem YouTube-Kanal, da die Menge an Formeln zu einem zu langen Artikel führen würde.

 

7 Videotutorial

 

8 Übungsdatensatz

 

9 Literatur

  • Cohen, J. (1992). Quantitative methods in psychology: A power primer. Psychol. Bull., 112, 155-159.
  • Wasserstein, R. L., & Lazar, N. A. (2016). The ASA statement on p-values: context, process, and purpose. The American Statistician, 70(2), 129-133.

 

Hat dir der Beitrag geholfen?

Dann würde ich mich über eine kleine Spende freuen, die es mir erlaubt, weiterhin kostenfreie Inhalte zu veröffentlichen.
Alternativ kannst du über meinen Amazon Affiliate-Link einkaufen – ohne Zusatzkosten.

Vielen Dank und viel Erfolg!

Über mich

Björn Walther

Ein 💚 für Statistik & Datenanalyse

Excel Online-Kurs

YouTube-Kanal

Inhalt