SC4 - tx8600y

Liebes NEPS-Team,

auf Basis des Geburtsjahres und des Erhebungsjahres würde ich gerne eine Altersvariable der teilnehmenden NEPS-Befragten der Startkohorte 4 in Welle 5 generieren. Leider hat die Variable tx8600y sehr viele designbedingte Missings. Ein Einblick in die Daten lässt mich vermuten, dass es sich dabei um Schüler*innen handelt, die via des PAPI-Instrumentes befragt wurden (N=4,441). Wie kommt es zu diesen vielen Missings und welche alternative Variable lässt sich denn für diese Fälle heranziehen, um das Alter der Befragten generieren zu können?

Besten Dank vorab.

Viele Grüße,
Emely

Hi Emely,

die Datumsangaben sind zugebenermaßen etwas verwirrend. Die Variable „tx8600m/y“ bezieht sich auf das Datum der CATI-Befragung. Diese fand erst im individuellen Kontext statt. Während des Hauptfeldes (also in der Schule) wurde via PAPI befragt. Die Datumsangaben dazu findest du in den Variablen „tx8610m/y“ und „tx8611m/y“.
Eine Möglichkeit, das Alter zu berechnen, wäre z.B. diese:

use "SC4_CohortProfile_D_12-0-0.dta", clear

// Starte mit Datum CATI-Interview
gen intdate = ym(tx8600y,tx8600m)
// auffüllen mit Datum Kompetenzerhebung 1
replace intdate=ym(tx8610y,tx8610m) if missing(intdate)
// auffüllen mit Datum Kompetenzerhebung 2
replace intdate=ym(tx8611y,tx8611m) if missing(intdate)
// auffüllen mit Datum Elternbefragung
replace intdate=ym(tx8620y,tx8620m) if missing(intdate)

// Geburtsdatum ggf. aus Vorwelle(n) holen
gen bdate = ym(tx8050y, tx8050m)
bysort ID_t (wave): replace bdate=bdate[_n-1] if missing(bdate)

// Alter berechnen
gen age=(intdate-bdate)/12

format intdate bdate %tm
br ID_t wave intdate bdate age // tx86* tx8050*

… super, vielen Dank!!

VG
Emely