Wir haben diese Anfrage bereits im April 2019 per Mail beantwortet, möchten aber die relevanten Punkte auch hier im Forum posten:
Ein erster Punkt ist, dass hier nicht alle Teilnehmenden der SC6 in die Analysen einbezogen werden, sondern dass lediglich ein Teil des Samples in einer bestimmten Altersspanne betrachtet wird. Sobald Einschränkungen vorgenommen und Subsamples analysiert werden, können die bereitgestellten Gewichte nicht mehr verwendet werden, denn es wird immer der gesamte Bestand der Teilnehmenden pro Welle gewichtet. Bei den Querschnittsgewichten der SC6 ist zusätzlich zu beachten, dass diese immer auch am Mikrozensus unter Berücksichtigung aller Geburtsjahrgänge der SC6 kalibriert sind.
Zu beachten ist auch, dass eine Gewichtung in Modellen nicht zwangsläufig notwendig ist und nur durchgeführt werden sollte, wenn die Gewichte überhaupt einen Einfluss auf die Analyse haben. Daher empfiehlt es sich zunächst zu testen, ob das Design informativ ist, d.h. ob die abhängige Variable in direkter Beziehung zu dem Design steht. Ein typisches Vorgehen ist z.B. die Gewichte als Kovariate in das Modell aufzunehmen und dieses mit dem Originalmodell zu vergleichen. Ob die Gewichte signifikante Effekte aufweisen, kann mittels eines LR-Test-basierten Modellvergleiches eruiert werden (Nachgelesen werden kann das in: 1) Snijders & Bosker (2012): „Multilevel Analysis“, Kapitel 14 Survey Weights. 2) Pfeffermann, D. (1998): „Weighting for unequal selection probabilities in multilevel models“, Journal of the Royal Statistical Society: Series B (Statistical Methodology), 60 (1), 23-40. 3) Rubin, D. (1985): „The use of propensity scores in applied Bayesian inference“, In: J. Bernardo, M. Degroot, D. Lindley, & A. Smith (Eds.), Bayesian statistics (Vol. 2,p. 463-472). Elsevier Science Publishers B.V.).
In vielen Fällen, so auch hier, empfiehlt sich ein modellbasiertes Vorgehen: Sämtliche Designvariablen und die Personenmerkmale, die in die Gewichtung einfließen (siehe Gewichtungsreports), werden als unabhängige Variablen in das Analysemodell aufgenommen. Wenn man so vorgeht, sollten sich keine Unterschiede mehr zwischen den gewichteten und den ungewichteten Analysen ergeben.
Eine Anmerkung noch zu der Mischung verschiedener Wellen im Falle von Querschnittsbetrachtungen: Wenn sich die Analysen nicht ausschließlich auf Daten einer Welle beschränken, muss plausibel angenommen werden können, dass die Daten aus der anderen Welle zeitunveränderlich sind.
Mit den besten Grüßen,
Uta Landrock vom Team Methoden der Survey-Statistik