Was sind fehlende Werte und wie sind sie definiert?

Fehlende Werte beschreiben (un-)absichtlich freigelassene Variablen in den Beobachtungen/Fällen im Datensatz. Welche unterschiedlichen fehlenden Werte es gibt und wie man sie in SPSS definieren kann, zeigt dieser Artikel.

Es gibt prinzipiell zwei Arten von fehlenden Werten. Zum einen die systemdefinierten und zum anderen die benutzerdefinierten fehlenden Werte. Wie man Fälle identifiziert, die Variablen mit fehlenden Werten haben, zeigt dieser Artikel: Fehlende Werte in SPSS identifizieren

 

Systemdefiniert fehlende Werte

Systemdefiniert fehlende Werte sind in SPSS in den einzelnen Zellen durch einen einfachen Punkt (.) erkennbar.

systemdefiniert fehlend spss

Bei dieser Art des fehlenden Wertes ist nicht bekannt, warum dieser fehlt. Mögliche Gründe sind Verweigerung, Unwissenheit des Befragten usw. Auf die verschiedenen und häufigsten Gründe von fehlenden Werten gehe ich bei den benutzerdefiniert fehlenden Werten ein.

 

Benutzerdefiniert fehlende Werte

Benutzerdefiniert fehlende Werte werden zumeist vom Ersteller der Umfrage definiert und sind eine Zahl. Es handelt sich dabei um unsinnige Werte, die auf keinen Fall im Wertebereich der Variable liegen können. Das soll verhindern, dass diese zufällig mit in die Auswertung einfließen. -99 ist so ein beliebter Wert, der einen fehlenden Wert darstellt. Wenn man eine Variable vorliegen hat, die nur positiv sein kann (Gewicht, Größe, IQ, Abiturschnitt,…) ist -99 schlicht unplausibel und lässt den Auswerte hellhörig werden. Die Codes werden entweder beim Export vom Anwender explizit definiert oder in einer Dokumentation hinreichend beschrieben. Es ist zudem möglich weitere fehlende Werte in SPSS zu definieren, hinter denen ein Code steht. Typische Gruppen von fehlenden Werten sind:

  • Explizite Verweigerung einer Antwort („Möchte ich nicht sagen“), z.B. -99
  • Frage-Item ist unbekannt („Kenne ich nicht“), z.B. -98
  • Keine Meinung zur Frage („Weiß nicht“), z.B. -97
  • Keine Angabe (Grund unbekannt), z.B. -96

Findet man also im Datensatz negative Werte, sollte man schauen, ob diese a) Sinn ergeben und b) ob man eine Information hat, warum diese Werte evt. diese Ausprägung haben. Zumeist werden bei Datenexporten Möglichkeiten eingeräumt fehlende Werte in Abhängigkeit des Grundes bereits vorzudefinieren. Das erspart es einem, die Werte manuell als benutzerdefiniert fehlend zu definieren.

Muss man sie dennoch definieren, geht das über die „Variablenansicht„. Die drei kleinen Punkte (…) in der Spalte „Fehlend“ sind da zu klicken:

variablenansicht spss

 

Im folgenden Dialogfeld kann man zwischen „keine fehlenden Werte“, „Einzelne fehlende Werte“ und „Bereich und einzelner fehlender Wert“ auswählen. Ich habe beispielhaft -99, -98 und -97 eingetragen. Ich hätte aber auch im Bereich -99 bei kleinster Wert und -96 bei größter Wert eintragen können.

fehlende werte spss

 

Was passiert bei der Auswertung mit Fällen mit fehlenden Werten?

Sie werden bei nahezu allen Auswertungen nicht mit einbezogen. Berechnet man einen Mittelwert, eine Korrelation oder eine Regression, fehlende Werte bewirken einen sogenannten listenweisen Ausschluss des kompletten Falls. Es ist also so, als ob der Fall gar nicht existiert.

 

Was kann man bei fehlenden Werten tun?

Wie schon gesagt, muss man nichts machen – Fälle mit fehlenden Werten werden bei Auswertungen ignoriert. Das Thema fehlende Werte in SPSS ersetzen behandle ich in diesem Artikel ausführlich, falls das Weglassen von Fällen keine Option ist.