SC4: pParent und Education mergen

Liebes NEPS-Team,

ich interessiere mich für den Kindergartenbesuch (aus pParent: p71202y/m) und den (höchsten) erreichten Schulabschluss (Education: tx28101) aller Kinder an Regelschulen. Dafür reichen mir die Daten im Querschnitt aus.
Mit Biography merge ich den Schulabschluss und übertrage den höchsten verzeichneten Abschluss auf alle Werte [bysort ID_t: egen max_abschluss=max(tx28101)]. Somit würde mir pro ID_t ein erfolgreicher match ausreichen, die restlichen Beobachtungen könnte ich dann für das Querschnittsdesign löschen [duplicates drop ID_t wave max_abschluss], da die genaue Beobachtungswelle für mich irrelevant ist. Den Umweg über Biography mache ich, da laut Matrix ein direkter match zwischen Education und pParent (mangels wave-Variable) nicht möglich ist.
Sobald ich jedoch dazu den pParent Datensatz merge, bekomme ich keinerlei matches. Gleiches ist auch der Fall, wenn ich nicht über Education, sondern die einzelnen Spell-Datensätze (spSchool etc.) versucht habe, den Abschluss der Kinder mit den Beobachtungen der Eltern zu mergen. Beim Mergen halte ich mich an die bereitgestellte Merging-Matrix (Biography & pParent: m:1 ID_t wave).
Auch aus pTarget lässt sich die subjektive, elterliche Bildungsaspiration (t320401) nicht erfolgreich mergen (Biography & pTarget: m:1 ID_t wave).
Übersehe ich etwas beim mergen der Daten von Eltern und ihren Kindern?

Vielen Dank und liebe Grüße
Susanne

P.S. Da ich mit RemoteNEPS arbeite, kann ich leider keine Syntax reinkopieren.

Liebe Susanne,

ohne das jetzt im Detail nachvollzogen zu haben: Ich fürchte, das liegt daran, dass nicht alle Informationen zeitgleich erhoben wurden. Eltern wurden z.B. nur in den Wellen 1, 5 und 7 befragt. Episodenmodule (und dazu gehört auch Biography und Education) nur in den Wellen, bei denen die Zielpersonen selbst im CATI befragt wurden (also erst ab Welle 3). Die Information aus der MergingMatrix ist dahingehend etwas irreführend, weil sie nur die theoretische Verknüpfbarkeit der Datensätze angibt, nicht aber die inhaltlich sinnvolle.

Wenn ich dich aber richtig verstehe, benötigst du die Information aber nur im Querschnitt, also einmalig pro Person. Dann brauchst du eigentlich auch keine Wellenvariable, der Umweg über Biography wäre gar nicht nötig. Ein Anreichern des Kohortenprofildatensatzes mit den von dir genannten Variablen könnte z.B. so aussehen:

** Education-Datensatz auf eine Zeile pro Person verdichten
use "SC4_Education_D_10-0-0.dta", clear
bysort ID_t: egen max_abschluss=max(tx28101)
keep ID_t max_abschluss
duplicates drop
tempfile abschluss
save `abschluss'

** pParent-Datensatz auf eine Zeile pro Person verdichten
use ID_t p71202* using "SC4_pParent_D_10-0-0.dta", clear
drop if missing(p712020) & missing(p71202m) & missing(p71202y)
duplicates drop
tempfile kiga
save `kiga'

** Beide Datensätze an den Kohortenprofildatensatz anspielen. 
** Die (gleiche) Information wird in allen Wellen zur Verfügung gestellt.
use "SC4_CohortProfile_D_10-0-0.dta", clear
merge m:1 ID_t using `abschluss', nogen keep(master match)
merge m:1 ID_t using `kiga', nogen keep(master match)

Kommst du so weiter?

Viele Grüße,
Tobias