Fehlende Werte bei Abschlussnote und Bundesland der Schule in spSchool, Kohorte 6

Hallo zusammen,

ich verwende für ein Projekt die Erwachsenenkohorte (SC6) der NEPS-Daten. Wegen der Verfügbarkeit der Variablen konzentriere ich mich auf das Paket der Welle 8. Ich benötige als Kontrollvariablen Angaben zum Bildungsniveau. Dazu verwende ich zum einen die Jahre der Bildung (aus der Basics-Datei). Zum anderen möchte ich die Note des höchsten (sekundären) Schulabschlusses verwenden (und einige weitere Angaben zum Schulabschluss). Dies habe ich aus der Datei spSchool konstruiert und hatte dazu schon einmal kurz mit einem LIfBi-Mitarbeiter korrespondiert. Es funktioniert zwar alles, aber es ist mir aufgefallen, dass bei den Variablen Abschlussnote (ts11218) und Bundesland der Schule (ts11202_g2) viele fehlende Werte auftreten. Es gibt insbesondere viele Fälle von „Missing by design“, was bei anderen Variablen nicht auftritt. Dadurch schrumpft meine finale Beobachtungszahl erheblich. Weiß jemand, weshalb viele Personen offenbar nicht nach ihrer Abschlussnote und dem Bundesland ihrer Schule gefragt worden sind? Ist nur eine bestimmte Gruppe gefragt worden? Das wäre wichtig zu wissen, um zu entscheiden, ob ich die Variablen in meiner Hauptanalyse verwenden sollte.

Ich wäre sehr dankbar, wenn jemand weiter weiß :slight_smile:

Viele Grüße
Adam Ayaita

Lieber Herr Ayaita,

Die designbedingten Missings (Code: -54) liegen für ts11218 ausschließlich und für ts11202_g2 überwiegend in Welle 1 (ALWA) verortet. Damals wurden diese Items dort einfach noch nicht erhoben.

Bei Analysen mit dem Basic-Datensatz muss beachtet werden, dass dort die Informationen zum jeweiligen letzten Interviewzeitpunkt vorliegen. Falls Sie mit dem aktuellsten SUF arbeiten und dort auf Welle 8 filtern, beziehen sich die Informationen aus dem Basic-Datensatz womöglich auf Angaben aus späteren Wellen.

Generell dient der Basic-Datensatz dazu, sich schnell einen ersten Überblick über die Daten machen zu können. Für weitergehende Analysen sollte er nicht verwendet werden.

Ich hoffe, dass ihnen diese Auskunft weiterhilft.

Viele Grüße
Alexander Helbig

Lieber Herr Helbig,

vielen Dank! Die Antwort hat mir sehr geholfen :slight_smile:

Ich würde gern noch fragen, wieso (bzw. inwiefern) Sie von der Verwendung der Basics-Daten abraten. Da mich der aktuelle Stand zum Interview-Zeitpunkt in Welle 8 interessiert, erschienen mir einige dieser Daten geeignet. Ich habe für einige Variablen (Geschlecht und deutsche Staatsangehörigkeit) geprüft, ob die Informationen identisch zu denen in der pTarget-Datei sind. Sie sind genau identisch.

Für eine Info wäre ich Ihnen wiederum sehr dankbar.

Mit freundlichen Grüßen
Adam Ayaita

Lieber Herr Ayaita,

Falls sie den SUF Datensatz der Welle 8 nutzen, trifft das von mir beschriebene Problem nicht zu.

Dennoch können generell bei der Nutzung des basic Datensatzes bestimmte Aufbereitungsschritte von Datennutzern nicht nachvollzogen werden. Beispiel: tx29063: Aktueller Beruf - bei Personen mit mehreren parallelen Erwerbstätigkeiten wurde hier NEPS-seitig bei der Datenaufbereitung eine Entscheidung getroffen welche Erwerbstätigkeit die Hauptaktivität darstellt. Diese Entscheidung sollte womöglich vom Datennutzer selbst getroffen werden. Bei Variablen wie etwa dem Geschlecht spielt das natürlich keine Rolle.

Bei der Nutzung der Bildungsjahre aus basic bleiben evtl.auch Fragen offen, die bei eigener Aufbereitung nicht bestünden.

In unserem Handbuch zur SC6 drücken wir es auf S.47 wie folgt aus: „This simplified
data structure can help to gain a first insight in the data. However, it should be handled with
care, as it may not feature the best information about the respondent. Please use this file only
to get a first overview of the data. Use the original panel or episode files for analyses!“

Viele Grüße
Alexander Helbig

Alles klar, danke! Dann weiß ich Bescheid.

Ich habe bewusst das Datenpaket aus Welle 8 verwendet (SC6_…_R_8-0-0.dta), damit sich keine späteren Entwicklungen hineinmischen.