Spearman-Korrelationskoeffizient in R berechnen

von | Aug 19, 2020 | Korrelation, R, Spearman

Ziel des Spearman-Korrelationskoeffizienten

Der Korrelationskoeffizient nach Spearman (auch Spearman-Rho) hat zum Ziel einen ungerichteten Zusammenhang zwischen zwei ordinalen oder auch metrischen Variablen zu untersuchen. Er zeigt entweder einen positiven Zusammenhang, einen negativen Zusammenhang oder keinen Zusammenhang. In der Nullhypothese geht er von keinem Zusammenhang aus.

 

Voraussetzungen des Spearman-Korrelationskoeffizienten in R

  • zwei ordinal skalierte Variablen oder eine metrisch skalierte und eine ordinal skalierte Variable
  • Häufig genannt: Linearität – gerade das untersucht man mit der Korrelation nach Spearman aber ohnehin

Sind die Voraussetzungen nicht erfüllt und ihr wollt dennoch korrelieren, schaut im Beitrag zur richtigen Wahl des Korrelationskoeffizienten nach Alternativen.  

 

Durchführung der Korrelation nach Spearman in R

Vorgehen im Detail in folgendem Video meines YouTube-Kanals

Dieses Video ansehen auf YouTube.

 

Voraussetzungsprüfung für den Spearman-Korrelationskoeffizienten

Normalerweise sind ordinal skalierte Variablen solche, die zwar auf- oder absteigend geordnet werden können, allerdings sind die Abstände zwischen den Ausprägungen nicht gleich oder interpretierbar oder beides. Fragen nach der Zustimmung zu einer Aussage oder Zufriedenheit mit einem Produkt oder Einkommensklassen („Likert-Skala“) erfüllen dieses Kriterium. Fasst man allerdings mehrere solche Variablen (z.B. via Mittelwert) zusammen, bildet also einen Score, werden sie häufig als als quasi-metrisch eingestuft, was eine Korrelation nach Pearson ermöglicht.  

 

Grafische Darstellung des Zusammenhanges in R

Parallel zu jeder Korrelation nach Spearman kann eine kleine Visualisierung des Zusammenhanges mittels Streudiagramm erfolgen. Das funktioniert mit dem plot()-Befehl: Für weitere grafische Anpassungen  gibt es diesen Beitrag.

plot(data_xls$Motivation, data_xls$Einkommen)

 

Im Ergebnis erhält man folgendes Diagramm:

Spearman Streudiagramm

Erkennbar ist, das mit zunehmender Motivation auch das Einkommen steigt. Ein positiver Zusammenhang ist also naheliegend. Wie stark ist dieser allerdings? Dazu braucht es den Spearman-Rangkorrelationskoeffizient.  

 

Berechnung der Korrelation nach Spearman in R

Die Korrelation nach Spearman ist zunächst denkbar einfach über die cor()-Funktion. Ich korreliere Einkommen und Motivation miteinander. Da ich den Dataframe nicht mit der attach-Funktion angehängt habe, verwende ich jeweils „data_xls$“ für die Variable. Wichtig ist hier unbedingt das Argument method=“spearman“ zu verwenden, da sonst keine Korrelation nach Spearman gerechnet wird.

cor(data_xls$Motivation, data_xls$Einkommen, method=“spearman“)

Als Ergebnis bekommt man: 0,4634837.

 

Interpretation der Ergebnisse der Korrelation nach Spearman in R

Nach der Durchführung der obigen Zeile erhalte ich einen nüchternen Output, der nur aus einer Zahl besteht und den Korrelationskoeffizienten angibt. In diesem Fall ist er 0,4634837. Eine Einordnung dessen erfolgt im Kapitel Ermittlung der Effektstärke. Was hier jedoch fehlt, ist die Signifikanz. Sofern sie gefordert ist, muss man sie sich zusätzlich ausgeben lassen. Das funktioniert mit der cor.test()-Funktion. Auch hier ist es wichtig method=“spearman“ als zusätzliches Argument aufzunehmen:

cor.test(data_xls$Motivation, data_xls$Einkommen, method=“spearman“)

 

Der Output hierfür ist etwas umfangreicher:

Spearman’s rank correlation rho

data: data_xls$Motivation and data_xls$Einkommen

S = 11857, p-value = 0.0006143

alternative hypothesis: true rho is not equal to 0

sample estimates:

rho

0.4634837

 

 

Fett markiert sind die wesentlichen Ergebnisse. Der untere Wert (rho) ist der Korrelationskoeffizient nach Spearman (auch Spearnan-Rho), der logischerweise immer noch 0,4634837 beträgt. Neu ist nun etwas weiter oben allerdings die Signifikanz. Die Signifikanz ist mit p=0,0006143 relativ klein, also sehr viel kleiner als die typische Verwerfungsgrenze von 0,05. Die Nullhypothese keines Zusammenhanges kann demnach verworfen werden. Folglich wird die Alternativhypothese eines korrelativen Zusammenhanges zwischen Motivation und Einkommen angenommen. Achtung: Eine Kausalität bedeutet das nicht. Es geht bei der Korrelation lediglich um das gleichzeitige Auftreten hoher und niedriger Ausprägungen beider Variablen.  

 

Gerichtete Hypothese und einseitiges Testen

Achtung: Wenn bereits eine Wirkungsvermutung vor dem Test existiert – die plausible Annahme, dass Menschen mit höherer Motivation ein höheres Einkommen erzielen – dann würde man 1-seitig testen. Hierzu darf die Signifikanz halbiert werden und ebenfalls mit dem Niveau von 0,05 verglichen werden. In diesem Falle ändert sich entsprechend nichts an der Aussage der Verwerfung der Nullhypothese.

 

Wer die Signifikanz nicht händisch teilen möchte, kann natürlich auch in R ein Argument der cor.test()-Funktion hinzufügen. Das Argument heißt alternative und lässt den Nutzer die Alternativhypothse definieren. Es gibt die Möglichkeiten alternative=“greater“ und alternative=“less“. Das kann verwirrend sein, denn „greater“ steht für einen positiven Zusammenhang und „less“ für einen negativen Zusammenhang. Am konkreten Beispiel unterstelle ich im Vorfeld einen positiven Zusammenhang:

cor.test(data_xls$Motivation, data_xls$Einkommen, method=“spearman“, alternative=“greater“)

 

Das Ergebnis ist sehr ähnlich zu oben. Änderungen habe ich fett hervorgehoben:

Spearman’s rank correlation rho

data: data_xls$Motivation and data_xls$Einkommen

S = 11857, p-value = 0.0003071

alternative hypothesis: true rho is greater than 0

sample estimates:

rho

0.4634837

 

 

Spearman-Rho ist natürlich mit 0,4634837 unverändert. Allerdings sieht man, dass sich die Signifikanz von p=0,0006143 auf p=0,0003071 halbiert hat. Das ist Folge des einseitigen Testens. Zusätzlich ist die nun anzunehmende Alternativhypothese eindeutig formuliert. Rho ist größer 0 (true rho is greater than 0) bedeutet, dass auf eine positive Korrelation vorliegt.

 

Ermittlung der Effektstärke des Spearman-Korrelationskoeffizienten

Die Effektstärke ist im Rahmen der Korrelation der Korrelationskoeffizient r selbst. Laut Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 79-81 sind die Effektgrenzen 0,1-0,3 (schwach), 0,3-0,5 (mittel) und größer 0,5 (stark).

Im vorliegenden Beispiel ist die Effektstärke mit 0,463> 0,3 und damit gerade noch mittel. Es handelt sich also um eine mittlere Korrelation zwischen Einkommen und Motivation.

 

Hat dir der Beitrag geholfen?

Dann würde ich mich über eine kleine Spende freuen, die es mir erlaubt, weiterhin kostenfreie Inhalte zu veröffentlichen.

Vielen Dank und viel Erfolg!

Über mich

Björn Walther

Excel- und SPSS-Experte

YouTube-Kanal

Excel Online-Kurs

YouTube-Kanal