Verwendung der Survey Weights in SC4 – welches Gewicht?!

Hallo liebes NEPS Methoden-Team,

ch habe mich neu hier im NEPSforum angemeldet, da ich Eure Hilfe bei der Anwendung der Survey Weights in Stata für die SC4 brauche.

Ich habe bisher die von Steinhauer und Zinn (2016) verfassten Technical Reports zur Anwendung der Survey Weight für die Wellen 1-6 sowie 7-9 der SC4 gelesen. Außerdem das von Zinn (2013) verfasste Working Paper zu den Replication Weights der Startkohorten 3 und 4.

Ich habe jetzt definitiv einen besseren Überblick über den Aufbau der Stichprobe, die Vorgehensweise beim Sampling und weiß nun auch darüber Bescheid wer in welcher Welle befragt wurde. Allerdings muss ich zugeben, dass ich auch nach dem Lesen dieser drei Berichte immer noch nicht weiß wie bzw. welche Gewichte für mich und die von mir geplante Analyse in Frage kommen. Hier brauche ich definitv eure Hilfe.

Kurze Erklärung zu meinem Forschungsvorhaben: Ich arbeite mit der SC4 und nutze dabei insbesondere die Daten der 3. Erhebungswelle. Allerdings möchte ich einige Informationen aus der Elternbefragung in Welle 5, die ich aus theoretischen Gründen als konstant ansehe, an meinen pTarget-Datensatz anspielen. Das Resultat ist somit ein Querschnittsdatensatz der sowohl Informationen aus pTarget Welle 3 und pParent Welle 5 beinhaltet.

Beim Durchstöbern der Datensätze habe ich im Datensatz “SC4_Weights_D_9-1-0.dta” die Querschnittsgewichte für Welle 3 (w_t3) und Welle 5 (w_t5) gefunden. Außerdem habe ich das in Steinhauer und Zinn (2016) angesprochene Gewicht für die Teilnahmewahrscheinlichkeit der Zielperson samt Elternteil (w_tp1_std) im Datensatz “SC4_RepWeights_D_9-1-0.dta” gefunden.

Den Stata-Beispielcode im Technical Report von Steinhauer und Zinn (2016) habe ich ebenfalls gefunden.

svyset ID_i [pweight = w_t1], strata(stratum_exp) ,, ID_cc

 

Meine Frage: Welches "pweight" verwende ich bei meinen Daten? w_t3, w_t5 oder w_tp1_std? Ich wäre wirklich sehr dankbar wenn mir jemand vom NEPS Methoden-Team eine kleine Hilfestellung geben könnte.

Viele Grüße

Patrick

Hallo Herr Schmitt,

die Frage, ob Sie Gewichte verwenden sollten, hängt zum einen von der konkreten Fragestellung ab. Da Sie unterschiedliche Befragungspersonen betrachten und eine Auswahl an Wellen nutzen (Schüler in Welle 3 und Eltern in Welle 5), gibt es für Ihren konkreten Fall kein entsprechendes Gewicht, das bereits in den Daten enthalten wäre. Das Gewicht w_t3 (w_t5) bezieht sich auf die an Welle 3 (Welle 5) teilnehmenden Schülerinnen und Schüler. Das Gewicht w_tp1_std hingegen auf die an Welle 1 gemeinsam teilnehmenden Eltern und Kinder der Welle 1. Am ehesten geeignet wäre also noch das Gewicht w_t3, wobei dieses die (mögliche) Selektivität der Elternteilnahme an Welle 5 nicht berücksichtigt.

Die Gewichte der SC4 beinhalten im Wesentlichen Informationen zu Design und Nonresponse, welche in den von Ihnen benannten Reports dokumentiert sind. Sobald das Design oder der Nonresponse einen Einfluss auf Ihre Analyse hat müssen Sie die Gewichte verwenden. Um das zu testen gibt es verschiedene Möglichkeiten, die in den nachfolgenden Beiträgen dargestellt sind:

  1. Pfeffermann, D. (1998). Weighting for unequal selection probabilities in multilevel models. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 60 (1), 23-40.
  2. Rubin, D. (1985). The use of propensity scores in applied Bayesian inference. In J. Bernardo, M. Degroot, D. Lindley, & A. Smith (Eds.), Bayesian statistics (Vol. 2,p. 463-472). Elsevier Science Publishers B.V.
  3. Snijder, T., & Bosker, R. (2012). Multilevel analysis: An introduction to basic and advanced multilevel modeling. In (2nd ed., p. 216-246). Sage Publications.

 

Für Rückfragen stehe ich Ihnen gerne zur Verfügung.

 

Mit freundlichen Grüßen

Hans Walter Steinhauer