ich möchte mit den SC6 Daten die retrospektiv erhobenen Bildungsverläufe deskriptiv darstellen und nutze dafür Teilnehmer, die in den Welle1, 2 und 4 gesampelt wurden. Nun möchte ich für eine repräsentative Darstellung der retrospektiv erhobenen Bildungsverläufe gewichten. Mir ist nicht ganz klar, welche Gewichte und wie ich diese hierfür benutzen kann.
Habe ich das richtig verstanden, dass ich für Teilnahme in Welle 2 und 4 die Gewichte w_t2_cal und w_t4_cal nutzen kann und es kein entsprechendes Gewicht für Welle 1 gibt? Bzw. sind alle Teilnehmer aus Welle 1 (n= 6,778) auch noch in Welle 2, sodass ich dies gar nicht benötige, sondern das Gewicht für Welle 2 diese miteinschließt?
Wie müsste ich denn dann den folgenden Befehl "svyset psu [pweight=w_t2_cal], strata(stratum)" abwandeln, um die Gewichtung korrekt für Personen aus Welle 2 als auch für Personen aus Welle 4 durchzuführen?
generell existieren keine Gewichte für retrospektiv erhobene Daten, da ein Gewicht für vergangene Ereignisse, die für verschiedene Individuen auch zu unterschiedlichen Zeitpunkten stattgefunden haben, nicht sinnig ist. Allerdings ist es möglich, sich Personenmerkmale im Querschnitt zu einem bestimmten Zeitpunkt anzuschauen (in diesem Fall zur 2. Welle und 4. Welle) und entsprechend zu gewichten. Wenn du es als sinnvoll erachtest, die Bildungsverläufe als Personenmerkmale zu betrachten, kannst du für die Personen der 1. NEPS-Welle das Gewicht w_t2_cal verwenden und für die Befragten der Auffrischungsstichprobe in der 3. NEPS-Welle das Gewicht w_t4_cal. Allerdings musst du dir über die unterschiedlichen zeitlichen Bezugspunkte dieser beiden gewichteten Analysen im Klaren sein (bei w_t2_cal das Jahr 2009 und bei w_t4_cal das Jahr 2011) und darfst diese nicht vermischen!
Wie du schon richtig festgestellt hast, gibt es für die reinen ALWA-Fälle kein Gewicht in den NEPS-Daten, aber diese stellen eine Teilmenge der Welle 2 Teilnehmer dar, sodass du diese Fälle so berücksichtigst.
Zu deinem Stata-Befehl, zunächst einmal benötigst du die Primary Sampling Units in diesem Fall nicht unbedingt und kannst die Definition der psu’s eigentlich weglassen. Zudem kannst und solltest du vor allem nicht beide Gewichte vermischt in diesem Befehl spezifizieren, sondern musst den Befehl bzw. die Gewichte für beide Analysen jeweils separat spezifizieren.
Ich hoffe, ich konnte dir mit meiner Antwort weiterhelfen.