ich möchte gerne mit der SC2 eine FE und Hybrid Regressionen rechnen.
Dafür verwende ich zeitkonstante Variablen aus Welle 1 und zeitvariable Variablen aus Welle 2 und 4.
Ich bin mir nun etwas unsicher bezüglich der Gewichtung, da das Sample ja beim Übergang von dem Kindergarten sehr massiv zusammenschrumpft.
Bisher habe ich folgendes in STATA gerechnet:
* Erstellung der Gewichtungsvariable (Kombination von Design- & Längsschnittgewicht
bysort ID_t (wave): gen slw_tp1234 = w_t_cal*w_tp1234
* FE Regression mit Gewichtung
xtreg Y X_1 X_2 X_3 [pw=slw_tp1234] , fe
da Sie Informationen aus verschiedenen Wellen (1, 2 und 4) nutzen, müssten Sie korrekter Weise das Gewicht w_t1234 verwenden. Das ist das entsprechende Längsschnittgewicht für die 504 Kinder, die an den Wellen 1, 2, 3 und 4 teilgenommen haben. In der Syntax beziehen Sie sich auf das Gewicht w_tp1234, das sich auf die 335 Eltern und Kinder bezieht, die gemeinsam an den Wellen 1, 2, 3 und 4 teilgenommen haben. Beide Gewichte (w_t1234 und w_tp1234) beinhalten bereits das Designgewicht (w_t_cal), weshalb Sie die Multiplikation hier nicht benötigen.
Da Sie sich hier nur einen kleinen Teil der SC2 anschauen, stellt sich die Frage, ob die Gewichtung überhaupt nötig ist. Die oben angesprochenen Gewichte korrigieren für ungleiche Auswahlwahrscheinlichkeiten (Design) und Nichtteilnahme (Nonresponse) an den entsprechenden Wellen. Je nach Fragestellung kann es nun sein, dass diese beiden Informationen des Gewichtes (Design und Nonresponse) keinerlei Einfluss auf Ihre Analyse haben. In diesem Fall könnten Sie die Gewichte vernachlässigen.
Darüber hinaus stellt sich die Frage, ob es sinnvoll ist (in Abhängigkeit von der Fragestellung) mittels gewichteter Analysen Aussagen über eine Population auf Basis von 504 bzw. 335 Fällen zu machen.