Variablen zur Ermittlung des Status (Schulbesuch, berufstätig etc.) von Jugendlichen in Welle 8 vom SC3

Hallo liebes Neps-Team und Nutzer*innen der NEPS-Daten,
wir arbeiten mit dem Datensatz zur SC3 und haben eine Frage bzw. ein Problem, dass wir selbst bislang nicht lösen konnten. Deswegen wende ich mich nun über das Forum an Sie und würde mich freuen, wenn Sie uns weiterhelfen könnten (auf meine Mail hat leider noch keiner geantwortet, da ich noch nicht weiß, was die bessere Plattform für Fragen ist, probiere ich es jetzt hier einfach auch noch).

Wir versuchen für unser Projekt herauszufinden, was die Jugendlichen in Welle 8 von SC3 gerade tun, also ob sie eine Schule besuchen, eine Ausbildung machen etc. Leider geben uns die bislang gefundenen Variablen noch nicht genug Aufschluss, vielleicht übersehen wir etwas?

Die Variable „tf40002“ zum „derzeitigen Status“ beantwortet die Frage für 2033 Fälle der Welle 8, wobei wir uns da fragen, was unter „andere Aktivität“ gefasst wird, da der Anteil relativ hoch ist?
Über „tf11404“ können wir Informationen zum Schulbesuch finden, hier werden 2018 Fälle aufgeklärt.
Von den 5263 Fällen in Welle 8 bleiben so über 1000 hinsichtlich ihres Status noch völlig ungeklärt.
Da ich auch nach Recherchen im Codebook nicht mehr weiter weiß, würde ich mich über Hinweise von Ihnen sowie Unterstützung durch Sie sehr freuen!

Vielen Dank!

Hallo Katrin,
tatsächlich ist das hier die bessere (weil auch für die Community transparente) Plattform, danke für deine erneute Anfrage hier. Ungeachtet dessen hätte es nicht passieren sollen, dass deine E-Mail-Anfrage so lange unbeantwortet blieb, dafür möchte ich mich entschuldigen.

Zur Sache:

Wie kompliziert es ist, die Frage nach dem „Status“ der Befragten zu beantworten, hängt vom Detailgrad der gewünschten Antwortvariable ab. Das liegt auch daran, wie im NEPS Schülerinnen und Schüler weiterbefragt werden, wenn sie die ursprüngliche NEPS-Schule verlassen: Ab diesem Zeitpunkt können unterschiedliche Befragungsmodi mit unterschiedlichen Inhalten zum Einsatz kommen (auch wenn selbstverständlich das theoretische Gesamtkonzept des NEPS über die Modi und Befragungsinstrumente einheitlich gemessen wird).

Beginnen wir zunächst mit dem grundlegenden Teil der Frage: Welche Schüler sind in welcher Teilbefragung in Welle 8 befragt worden (ich illustriere hier mit Stata-Syntax; natürlich geht das auch in SPSS, R, oder jeder beliebigen anderen Statistiksoftware)? Das lässt sich am schellsten direkt über den zentralen Datensatz CohortProfile ermitteln:

// zur Vereinfachung: -neps:- Kommando verwenden;
// falls nicht vorhanden, Installation via:
// . net install nepstools , from(http://nocrypt.neps-data.de/stata)
neps set study SC3
neps set version 9.0.0
neps set level D

// CohortProfile öffnen, Befragungstrack der Teilnehmenden in Welle 8 auszählen
neps : use CohortProfile

tabulate tx80230 if wave==8 & tx80220==1

Es zeigt sich, dass von den 5263 Teilnehmenden in Welle 8 knapp 2000 noch auf der ursprünglichen NEPS-Schule befragt wurden (tx80230==1), und die übrigen gut 3300 individuell nachverfolgt worden sind [entweder war dabei schon vorab bekannt, dass sie das allgemeinbildende Schulsystem verlassen haben (tx80230==3), oder nicht (tx80230==2); das ist hier aber nicht erheblich].

Nur die Personen in der Individualbefragung haben eine computergestützte Befragung erhalten; sie ist deutlich umfassender als die papierbasierte Befragung im Schulkontext, insbesondere auch weil dort die Schulhistorie der Personen retrospektiv erhoben wird. Diese computergestützten Befragung enthalten (unter anderem) diverse Hilfsvariablen, die zur Interviewsteuerung verwendet werden (und deshalb, um die Filterführung nachvollziehen zu können, auch im SUF enthalten sind). Die zwei von euch entdeckten Variablen sind solche Hilfsvariablen. Sie sind also systematisch nicht für Personen befüllt, die noch im NEPS-Schulkontext befragt werden.

Ab hier beginnt nun der schwierige Teil der Frage. Wie detailliert wollt ihr wissen, was die Personen, die nicht mehr an einer NEPS-Schule befragt werden, tun? Da hilft letztlich nur der Blick in die berichtete Biografie. Kurz zusammengefasst sollte man dafür

  1. Das Interviewdatum zu Welle 8 ermitteln

  2. aus den Episodendaten (am einfachsten: dem Servicedatensatz Biography) diejenige(n) Episode(n) ermitteln, die zum Interviewzeitpunkt andauerten

  3. falls gewünscht: weitere Informationen zu den einzelnen Episoden aus den „echten“ Biografiemodulen (spSchool, spVocTrain, etc.) aus der Befragung über die Variablen ID_t und splink anspielen (Achtung: vorher im jeweiligen Biografiemodul keep if subspell==0 ausführen und zwischenspeichern).

  4. und 2. ginge in Stata bspw. so:

// Interviewdatum aus CohortProfile ermitteln, temporär speichern
neps : use CohortProfile , clear
keep if tx80220==1 & tx80230!=1
keep if wave==8
keep ID_t intm inty
generate intdate_wave8=ym(inty,intm)
format intdate_wave8 %tm
tempfile intdates
save `"`intdates'"'

// Biography öffnen, Interviewdatum anspielen
neps : use Biography
nepsmiss startm starty endm endy // Fehlwerte ausschließen
merge m:1 ID_t using `"`intdates'"' , nogenerate keep(match)

// Start- und Enddatumsvariablen der Episoden berechnen
generate begindate=ym(starty,startm)
generate enddate=ym(endy,endm)
format begindate enddate %tm

// zum Befragungszeitpunkt Welle 8 andauernden Episodentype generieren
generate sptype_wave8=sptype if (inrange(intdate_wave8,begindate,enddate))
label values sptype_wave8 `: value label sptype'
keep if !missing(sptype_wave8)
keep ID_t splink sptype_wave8

Das Problem, dass alles etwas kompliziert macht, ist nun letztlich, dass Befragungspersonen parallele Episoden ihres Lebenslaufs berichten. Das ist oftmals völlig plausibel (bspw. ein Schulbesuch und gleichzeitig eine geringfügige Beschäftigung als Nebenjob, oder zwei parallele Teilzeitbeschäftigungen), aber nicht immer. Welchen Episodentyp ihr als „dominant“ betrachtet, ist abhängig vom Forschungsinteresse.

Ich hoffe, das hilft euch etwas weiter bei eurem Vorhaben. Wenn nicht, meldet euch gerne wieder.

Beste Grüße
Bela