auf Grundlage der SOEP v40.1 haben wir den Zeitverlauf der Armutsrisikoquote seit 2012 berechnet. Vergleichen wir das mit Berechnungen auf Grundlage der v39, zeigen sich zum Teil deutliche Unterschiede. Laut Dokumentation gab es eine Anpassung der Gewichte für 2020 und 2021, allerdings finden wir Unterschiede auch in weiter zurückliegenden Zeitpunkten. Habt ihr eine Idee, warum das so sein könnte?
Zur Berechnung greifen wir auf den pequiv-Datensatz zurück. Wir berechnen das Nettoäquivalenzeinkommen mit Hilfe der Informationen zum Vorjahreseinkommen des Haushalts (i11102, i11105) und der Anzahl der Haushaltsmitglieder im entsprechenden Alter (h11101, h11102) und gewichten mittels der individuellen Querschnitts-Gewichtung - ohne erste Welle einer Teilstichprobe (w11101).
solche Unterschiede wirst du bei alen SOEP-Versionen finden. Dies hat vor allem 2 Gründe: Erstens gab es wie bereits von Dir genannt rückwirkend eine Revision der Gewichtungsfaktoren, da neue Randinformationen des Mikrozensus vom Statistischen Bundesamt geliefert wurde. Solche Revisionen kommen immer wieder vor und können auch früheren Wellen des SOEP betreffen . Zum Anderen wird bei der Generierung von den PEQUIV-EInkommensvariablen eine längsschnittbasierte Imputation verwendet. Dies hat zur Folge, dass mit jeder neuen Datenversion, alle Einkommen neu imputiert werden (auch rückwirkend), da davon auszugehen ist, dass mit jeder zustzlichen Erhebungswellen zusätzliche Informationen zur Verfüung stehen, die die Imputation verbessern können.
Diese beiden Änderungen sollten bei der Armutsrisikoquote nur zu Änderungen im Nachkommabereich führen.
vielen Dank für deine schnelle Rückmeldung und Klärung!
Bei der Armutsrisikoquote insgesamt waren es wirklich geringfügige Änderungen. Bei den unter 18-Jährigen lag mit unserer Berechnung der Unterschied für 2020 und 2022 (Survey-Jahre, Einkommensjahre 2019 und 2021) tatsächlich über einem Prozentpunkt. Und auch für 2015, 2016 und 2018 waren die Abweichungen etwas höher (wenn auch wie du schreibst im Nachkommabereich).
So wie ich deine Erklärung lese sind auch diese größeren Änderungen aufgrund der Gewichte denkbar?
die Abweichungen sind vor allem der revidierten Gewichtung geschuldet. Revisionen sind “leider” immer wieder etwas, was nich tnur im SOEP, sondern auch in der amtlichen Statistik immer wieder vorkommt …