Multiple Imputation von Individualmerkmalen in SC4 (w1/2)

Liebes NEPS-Team,

ich arbeite gerade an Imputationsmodellen (MICE), bei denen es vorrangig um missings in Kompetenzdaten (Mathematik, Lesen, Nawi, Schlussfolgerndes Denken) und anderen Individualmerkmalen (Selbstwert, schul. Selbstkonzept, Gewissenhaftigkeit, prosoziales Verhalten) geht (SC4, Erhebungswelle 1/2). Gibt es studiendesignbezogene Variablen, die unbedingt in multiplen Imputationsmodellen als Missingmechanismus berücksichtigt werden sollten, z.B. stratum?

Vielen Dank und viele Grüße
Jennifer

Liebe Jennifer,

zur Beantwortung deiner Frage werde ich etwas weiter ausholen, da die Sachlage doch etwas komplexer ist.

Für die Aufstellung von Imputationsmodellen gilt es verschiedene Dinge zu berücksichtigen: Die Modelle sollten a) den eigentlichen Analysemodellen entsprechen, b) mindestens die Variablen aus dem Analysemodell beinhalten, und c) vor allem Variablen beinhalten, die den Nonresponse erklären können.

@ a) Bei einem einfachen Logitmodell ist das einfach, ein Multilevel-Modell ist jedoch schon schwieriger zu imputieren.
@ b) Einschließlich der abhängigen Variable sowie Interaktionseffekten, Polynomen usw.
@ c) Hierunter können mehrere Variablen fallen. Beispielsweise könnte man plausibel annehmen, dass die Variablen, die den Unit-Nonresponse (UNR) erklären ebenso den Item-Nonresponse (INR) erklären, sodass man die Variablen aus den Gewichtungsmodellen ebenfalls hierfür verwenden kann: stratum_exp sowie stratum_imp2, Altersgruppe (halbiert am Median), Migrationshintergrund, Muttersprache (diese können dem zugehörigen Gewichtungsreport entnommen werden: https://www.neps-data.de/Portals/0/Survey%20Papers/SP_II.pdf)

Wichtig ist, sich darüber im Klaren zu sein, dass man Imputationen nur verwendet um für INR zu korrigieren und für UNR besser Gewichte oder ein modellbasiertes Korrekturverfahren verwendet. Nebst INR, gibt es in Welle 1 und 2 Zielpersonen, die zum einen temporäre Ausfälle waren - zu denen also keinerlei Information in dieser Welle vorliegt - und Zielpersonen, die nur an den Testungen nicht teilgenommen haben (Unterschied zwischen tx80220 und tx80522 im CohortProfile). Unabhängig von Nonresponse kann es außerdem der Fall sein, dass bestimmte Informationen designbedingt, z.B. aufgrund von Testheftzuweisung, fehlen. Diese zu imputieren ist genauso wenig plausibel.

Ich wünsche gutes Gelingen.

Herzliche Grüße
Ariane