Höchster erreichter Schulabschluss SC3 (tx28101)

Liebes NEPS-Forum,

ich interessiere mich für den höchsten erreichten Schulabschluss in der SC3 und hab hier im Forum schon einige hilfreiche Informationen zu der Variable tx28101 entdeckt - insofern danke schon mal dafür! Die Variable erscheint mir super praktisch, allerdings wundere ich mich darüber, dass über 5.000 Zielpersonen keinen Abschluss erreicht haben sollen. Ich vermute das kommt daher, dass keine fehlenden Werte vergeben wurden. Jetzt frage ich mich, inwiefern man die Variable so verwenden kann bzw. inwiefern man noch fehlende Werte vergeben müsste - z.B. für Zielpersonen, von denen ab einer noch zu definierenden Welle keine Informationen mehr vorliegen. Mein Ziel ist es, so gut wie möglich zwischen „kein Abschluss“ und fehlenden Werten zu unterscheiden.

Dazu zwei Fragen: Was wäre aus euer Sicht hier generell das beste Vorgehen? Und anhand welcher Informationen ließen sich die fehlenden Werte nachträglich sinnvoll vergeben?

Danke schon vorab und beste Grüße
Jannis

Lieber Jannis,

keine Sorge, so viele Personen ohne Abschluss gibt es gar nicht. In der letzten Datenversion (12.0.0) sind es gerade mal 100, was etwa 0,85% aller Personen entspricht.
Dein Denkfehler lässt sich auch ganz leicht auflösen.
Offenbar hast du dir die erreichten Bildungsabschlüsse im Datensatz Education angesehen, richtig?
Wenn du dir einfach mal die zugrunde liegende Datenstruktur in diesem Datensatz ansiehst, wirst du feststellen, dass die allermeisten Befragten hier mindestens zwei Einträge haben.
Es werden im Datensatz Education nämlich nicht nur die letzten erreichten Bildungsabschlüsse integriert, sondern ALLE. Und alle Personen starten ab Beginn erstmal in der Kategorie „kein Abschluss“, dh es gibt soviele Zeilen ohne Abschluss wie es Personen gibt.
Wenn du nur am jeweils höchsten erreichten Bildungsabschluss interessiert bist, müsstest du den Datensatz noch weiter begrenzen. In Stata geht das zum Beispiel so:

use SC3_Education.dta, clear
bysort ID_t: egen maxedu = max(tx28101)
keep if tx28101 == maxedu

Beste Grüße und viel Erfolg,
Benno Schönberger

Lieber Benno,

ah, das erklärt meine Verwirrung natürlich. Herzlichen Dank für die schnelle Antwort!

Jannis

Hallo zusammen, ich habe ein ähnliches analytischen Vorgehen wie oben beschrieben angewandt und bin mir aber tatsächlich noch unsicher, wie die Unterscheidung des tatsächlichen „Kein Abschluss“ und fehlende Werte funktioniert.

Nehmen wir mal an, dass Person XY zu Beginn des Panels (=2010; Klasse 5) die Eintragung „kein Abschluss“ bekommen hat und dann aber in Welle 3 (2012/13; Klasse 7) dauerhaft aus dem Panel ausscheidet. D.h. diese Person hatte in Klasse 5 logischerweise keinen Schulabschluss und konnte auch bis zur 7. Klasse logischerweise keinen erreichen. Nach der oben beschriebenen Logik hat diese Person dann im Education-Datensatz in der Variable tx28101 eine Eintragung: nämlich 0 „Keinen Abschluss“. Bei dieser Information handelt es sich ja dann aber nicht um den tatsächlich erreichten Schulabschluss, sondern vielmehr um den einzigen bekannten Schulabschluss. Zur Untersuchung des höchsten Schulabschlusses müsste diese Person korrekterweise ja eigentlich ausgeschlossen werden. Wie kann ich also unterscheiden, ob die Person wirklich keinen Schulabschluss gemacht hat oder ob die Person frühzeitig aus dem Panel ausgeschieden ist und somit keine neueren Infos zum Schulabschluss vorliegen? Oder sind diese Fälle im Education-Datensatz gar nicht mehr vorhanden?

Besten Dank vorab und viele Grüße
Emely

Liebe Emely,
der Datensatz Education ist in erster Linie auch nicht dazu gedacht, erworbene Schulabschlüsse zu untersuchen, sondern Veränderungen in der CASMIN- oder ISCED Skala abzubilden. So gibt es hier zB einige Fälle, für die man in den Rohdaten der Schulepisoden in spSchool gleich mehrere Schulepisoden finden kann, die jedoch allesamt ohne Abschluss abgeschlossen wurden. Da diese jedoch alle für CASMIN und ISCED irrelevant sind, landet nur die Abschlussinfo des ersten berichteten Schulspells in Education und das ist eben für die allermeisten Personen eine Grundschulepisode, in der die Person noch keinen Abschluss erreichen konnte.
Wenn man gezielt den höchsten jemals erreichten Schulabschluss einer Person untersuchen möchte, kann man das natürlich auch mit dem Education-Datensatz, muss sich aber dann halt über dessen Struktur und Zweck im Klaren sein. Zudem kann man sich über die Teilnahmeindikatoren tx80220 tx80521 aus CohortProfile hier noch Zusatzinfos heranziehen, ob eine Person das Panel schon verlassen hat. Auch die detaillierten Infos aus dem Datensatz spSchool geben hier vielleicht nochmals mehr Aufschluss darüber, ob eine Person das Schulsystem wirklich ohne Abschluss (ts11209) verlassen hat. Egal welche Analyse man im Sinn hat, kommt man um eine etwas tiefer gehende Betrachtung gerade derjenigen Beobachtungen mit „kein Abschluss“ als höchstem Abschluss nicht herum.

Beste Grüße und viel Erfolg,
Benno Schönberger