SC6 spEmp-Datensatz, letzte Information zum Stellenumfang

Liebes NEPSforum,

ich habe eine Frage zum spEmp-8-0-0 Datensatz der SC6.

Ich brauche nur eine Variable aus dem Datensatz: ts23221 (Stellenumfang am Ende/heute, d. h. Vollzeit/Teilzeit)

Und ich brauche die Variable nicht als Spell-Variable, sondern mir reicht die Information des letzten Spells der Welle6, d. h. Person X ist zum Zeitpunkt Y (Welle6) in Vollzeit oder Teilzeit beschäftigt. Jetzt habe ich mir folgendes überlegt:

keep if wave <= 6 

oder

keep if wave == 6 

wenn ich == 6 verwende, sind nur noch wenige Beobachtungen übrig

keep ID_t wave ts23221 splink spell subspell
keep if subspell == 0 (habe ich im Data Manual gelesen)
sort ID_t splink
by ID_t : egen ns = max(splink)
drop if splink != ns
-> Somit habe ich nur noch eine Zeile pro Person mit der Information des höchsten Wertes bei splink (also der letzten Information zu Vollzeit/Teilzeit, oder?)

Ergeben meine Überlegungen Sinn? Ich möchte den Datensatz später mit dem pTarget-Datensatz (nur Welle6, d. h. wide-Format) mergen. Wenn ich nach ID_t und wave merge fallen auch wieder die wave <= 6 Informationen weg und ich erhalte sehr viele Missings bei Vollzeit/Teilzeit. Aber wenn ich die Welleinformation beim mergen weglasse, habe ich veraltete Informationen aus vorherigen Wellen gemerged und es kann sein, dass die Person zwar in Welle 5 Vollzeit erwerbstätig war aber in Welle6 nicht mehr, oder? Mein pTarget-Datensatz, den ich bereits mit anderen Datensätzen gemerged habe (Basics und spVolunteerWork) hat 10639 Beobachtungen, wenn wave == 6 ausgeführt wird oder nach ID_t und wave gemerged wird, werden ca. 1500 Informationen zu Vollzeit/Teilzeit dazugespielt, mir kommt das sehr wenig vor.

Ich hoffe ich konnte meine Frage/mein Problem verständlich ausdrücken und würde mich sehr über eine Antwort freuen!

Liebe Grüße,

Katharina


Edit: Code-Blöcke eingefügt.

 

 

Hallo Katharina,

prinzipiell sind deine Überlegungen schonmal sehr gut.

Allerdings bin ich mir noch nicht 100&ig sicher, ob ich dich richtig verstanden habe: Möchtest du zwingend die letzte Information verwenden, die in Welle6 gegeben wurde oder (falls eine Person nicht in W6 teilgenommen hat) generell die letzte gültige, die wir im Datensatz haben? Für Szenario 1 müsstest du keep if wave ==6 ausführen, für Szenario 2 keep if wave <= 6. Das ist ein wesentlicher Unterschied, der logischerweise auch die völlig unterschiedlichen Fallzahlen erklärt.

Je nachdem wie du diese Informationen aus spEmp dann an deine anderen Datensätze hinzuspielst, ergeben sich natürlich auch andere Fallzahlen. Das ist aber komplett abhängig davon, was du überhaupt analysieren möchtest. Angenommen du möchtest für jede Person in jeder Zeile die Information des letztmalig berichteten Stellenumfangs haben (warum auch immer), dann würde ich einen m:1 merge nur auf Basis der ID_ts empfehlen. Wenn du allerdings nur für die Welle6 Zeilen in deinem Datensatz den Stellenumfang dabei haben möchtest, dann solltest du einen 1:1 merge mit ID_t und wave machen. Und natürlich wird da dann die Zahlzahl für diejenigen, deren Werte du da mergen kannst, auch sehr gering sein. Das ist aber alles wie gesagt eine Frage des Forschungsziels.

Dein Vorgehen zur Vorbereitung der spEmp Zeilen ist so aber korrekt.

Ich hoffe, ich konnte dir damit weiterhelfen.

Viele Grüße,

Benno