SC2: Krippe und Sekundarstufe

Liebes Forum,

Ich möchte mit den SC2 Daten arbeiten und benötige die Variable zum Krippenbesuch vor Einschulung (p711001; ab Welle 3) und zur besuchten Schulform in der aktuellsten Welle (t723503). Leider gibt es hier sehr unerwartet keine gemeinsamen Fälle - alle Datenpunkte zur Schulform haben keine zum Krippenbesuch und umgekehrt. Auch andere Variablen zur Schulform enthalten keine Informationen für die Kinder, die die Frage zur Krippe beantwortet haben.
Da das Sampling in dieser Startkohorte nicht unkompliziert ist wollte ich mich vergewissern, weshalb diese beiden Variablen keine gemeinsamen Werte aufweisen.
Gemäß dem Technical Report No. 66 (Steinhauer, Zinn, Gaasch & Goßmann 2016) gibt es 3 Gruppen (siehe unten), wobei es sich um Gruppe 1 oder 3 handeln muss, für die längsschnittliche Daten zur Schulform vorhanden sein müssten. Übersehe ich hier etwas oder existieren die Daten tatsächlich nicht?

Danke und liebe Grüße
Susanne

Group 1 The group of students tested in Grade 1 in elementary schools, who were not
tested in Kindergarten institutions in Wave 1 and Wave 2. These (target) persons
form augmentation sample of Wave 3.
Group 2 The group of Kindergarten children, who were only tested in Kindergartens in
Wave 1 and Wave 2. In Wave 3, they are assigned to the individual retracking
field and are temporary dropouts by design until Wave 6.
Group 3 The group of Kindergarten children, who were tested in Kindergartens in Wave 1
and Wave 2 and transition to elementary schools surveyed by NEPS in Wave 3.
These (target) person belong to the longitudinal sample of Wave 1, 2, and 3.“ (ebd.: 5).

Liebe Susanne,

auch wenn die Daten nicht gemeinsam erhoben wurden, heißt das ja nicht, dass man sich die Informationen nicht zusammenbauen kann.
Ich kann zwar gerade nicht genau abschätzen, in welcher Art und Weise du diese beiden Informationen zusammenbringen bzw zusammen analysieren möchtest, allerdings bezieht sich die Frage nach dem Krippenbesuch ja auf eine zeitunveränderliche Information. Das Kind hat entweder eine Krippe besucht oder nicht.
Für Welle 3 ist davon auszugehen, dass sich alle Kinder erstmal in der Grundschule befinden. Anhand von Variable p723080 (in pParent, erhoben in W4) kann man das für das 2. Grundschuljahr noch ein klein wenig weiter differenzieren, auch wenn hier knapp 94% immer noch an einer regulären Grundschule zu finden sind. Und die aktuelle Schulform findest du erst ab Welle 7 (wenn die Kinder in der 5. Jahrgangsstufe sein müssten, also schon der erste Übergang erfolgt sein könnte) in Variable t723503 in pTarget.
Je nachdem, wie du die Daten nun analysieren möchtest, würde ich vorschlagen, die entsprechenden Variablen einfach zusammenzuspielen und dann die zeitkonstante Information zum Krippenbesuch auf alle entsprechenden Datenzeilen fortzuschreiben.
Das könntest du beispielsweise wie folgt tun:

// pTarget kann ohne einen kleinen Zwischenschritt nicht eindeutig an andere Datensätze gespielt werden, weil hier unter Umständen doppelte Datenzeilen enthalten sind

use [Speicherort pTarget]
keep if ex20100 ==1
tempfile pTarget
save `pTarget', replace

// wenn du hier nicht mit einem temporären File arbeiten möchtest, einfach lokal speichern und dann beim merge den Speicherpfad angeben

use [Speicherort pParent], clear
merge 1:1 ID_t wave using `pTarget', keepusing(t723503) keep(master match)

// Jetzt generieren wir uns eine zeitkonstante Variable aus t723503
bysort ID_t: egen krippe = max(t723503)

Und nun kannst du die Informationen wie auch immer du möchtest auch zusammen analysieren.
Und um zB auch die Schulforminformationen alle zusammenzubringen, musst du halt aus den verschiedenen Quellen (wie oben beschrieben) noch eine gemeinsame Variable bilden.

Viele Grüße und viel Erfolg weiterhin,
Benno Schönberger

Lieber Benno,

vielen Dank für deine schnelle und ausführliche Rückmeldung!
Allerdings ging es mir um etwas anderes: Deine Ausführungen oben habe ich ähnlich wie du durchgeführt, sprich pTarget und pParent gemerged.
Wenn man sich dann jedoch die gemeinsame Verteilung von Krippenbesuch ja/nein und der Schulform ansieht (siehe tab-Befehl), gibt es quasi ausschließlich „designbedingt fehlend“ Angaben zur Schulform für die Kinder, zu denen Informationen zur Krippenfrage vorliegen, sowie umgekehrt, für alle Beobachtungen, die Angaben zur Schulform haben, ist die Krippen-Angabe ein Missing.

tab p711001 t723503, m

Deine Antwort hat mir jetzt aber nochmal einen wichtigen Impuls gegeben, mein Problemchen zu lösen - vielen lieben Dank!

Liebe Grüße
Susanne