SC6, 7. Welle: aktuelle, hauptsächlich ausgeführte berufliche Tätigkeit

Liebes NEPS-Team,

meine Frage an Euch betrifft die Startkohorte der Erwachsenen (SC6) und die Datenversion doi:10.5157/NEPS:SC6:9.0.1. Für meine Analysen bräuchte ich eine Variable, die mir für die 7. Welle anzeigt, welche berufliche Tätigkeit die befragte Person zum Erhebungszeitpunkt hauptsächlich (= nicht als "Zweitjob", keine SchülerInnen, StudentInnen, RenterInnen, Arbeitslose, Erwerbsunfähige, Hausfrauen/Hausmänner) ausübt - codiert nach der KldB 2010. Vermute ich richtig, dass eine solche Variable nicht existiert, sondern mit Hilfe der spEmp-Spell-Daten, insbesondere mit Hilfe der Variablen wave (=7), ts2312c (=1) und ts23201_g2 konstruiert werden muss?

Wenn ich es richtig sehe, dann zeigt die Variable ts23201_g2 - gefiltert für die 7. Welle - an, welche berufliche Tätigkeiten zum Erhebungszeitpunkt der 7. Welle ausgeübt wurde; mit dem Wert -29 wird angezeigt, dass die berufliche Tätigkeit, die in der vorherigen Episode angegeben wird, auch zum Erhebungszeitpunkt ausgeführt wird. Pro Person und Erhebungszeitpunkt sind mehrere berufliche Tätigkeiten möglich.

Damit bliebe das Problem, dass pro ID_t und Welle mehrere Nennungen für ts23201_g2 möglich sind und eine Auswahl hinsichtlich der hauptsächlich ausgeführten Tätigkeit getroffen werden muss. Das könnte man evtl. mit Hilfe des Stellenumfangs umsetzen (ts23221). Falls der Wert ts23201_g2 "-29" ist, müsste man die berufliche Tätigkeit der vorherigen Episode verwenden und darauf vertrauen, dass der Stellenumfang konstant geblieben ist. Bin ich auf dem richtigen Weg oder geht esf (viel) einfacher? Ich dachte daran, den Basic Datensatz der Version doi:10.5157/NEPS:SC6:7.0.0 zu benutzen - dort sind zwar Infos zum aktuellen Beruf, d.h. zum Erhebungszeitpunkt der 7. Welle aufgeführt, jedoch nicht der KldB-Code.

Besten Dank!
Florian

Lieber Florian,

den KldB-Code für die Erwerbstätigkeit, die eine Person zum Interviewzeitpunkt der 7. Welle ausübt, findest du tatsächlich nur im spEmp-Datensatz und musst die relevante Information für dein Analyseziel noch aufbereiten. Dabei ist es wichtig, zu verstehen, dass die Wave Variable hier keineswegs einen Anfangs- oder Endzeitpunkt einer Episode angibt, sondern lediglich die Information bereithält, in welcher Befragungswelle die verschiedenen Episoden aufgenommen wurden.

Um herauszufinden, welche Personen zum Interviewzeitpunkt der 7. Welle ein bestimmtes Merkmal aufweisen, musst du dir zunächst die Interviewdaten aus dem Methodendatensatz an spEmp anspielen. Das kannst du prinzipiell mittels folgender Syntax machen:

merge m:1 ID_t wave using "[Datenpfad]/SC6_Methods_[ODR]_9-0-1.dta", keepusing(intm inty) keep(match) nogen nolabel

Anschließend musst du diejenigen Fälle identifizieren, bei denen das Enddatum der Episode gleich dem Interviewdatum ist: Dazu konvertieren wir beide Datumsangaben der Einfachheit halber ins Stata-Datumsformat:

gen interview = ym(inty,intm)
gen end = ym(ts2312y,ts2312m)
format interview end %tm
gen int7 = interview ==end & wave ==7

Wenn wir uns jetzt diejenigen Episoden ansehen, die genau zum Interviewzeitpunkt geendet haben, so erkennen wir, dass es hier für die ts23201_g2 sehr sehr viele Einträge mit dem Wert "-29 Wert aus letztberichteter Episode" gibt. Nun gilt es also, diese Werte mit dem letzten gültigen Wert aufzufüllen. Das können wir mittels folgender Sytnax:

clonevar erwerb = ts23201_g2
replace erwerb = . if erwerb <0
bysort ID_t spell (subspell): replace erwerb = erwerb[_n-1] if missing(erwerb)

Jetzt behalten wir nur noch diejenigen Fälle, die uns wirklich interessieren:

drop if spgen == 1   // harmonisierte Episoden wergwerfen, die sorgen hier nur für Duplikate
keep if int7 == 1

Nun musst du dir nur noch überlegen, wie du mit denjenigen Personen umgehst, die zum Interviewzeitpunkt mehr als eine Erwerbsepisode angegeben haben beziehungsweise denjenigen Job identifizierst, den die Personen "hauptsächlich" ausgeübt haben (vielleicht über den Stellenumfang?) und solltest diese Daten dann normalerweise problemlos zu deinen anderen Daten für deine Analyse anspielen können.

Viele Grüße,

Benno

Lieber Benno,

super, herzlichen Dank für Deine schnelle Antwort und den Lösungsweg!

Beste Grüße

Florian