Unstimmige Migrationsjahre im IAB-BAMF-SOEP Datensatz (M3-M6)

Liebes SOEP-Team und Community,

ich arbeite derzeit mit den SOEP-Core-Daten, um Einflüsse von Integrationskursen auf die psychische Gesundheit von Geflüchteten zu untersuchen. Dafür möchte ich mit den Befragungen M3-M6 arbeiten. Wie bereits in einem vorigen Forum-Beitrag beschrieben, habe ich dafür den ppathl Datensatz auf $psample (= 17, 18, 19, 24) gefiltert – also die Befragungen M3-M6.

Allerdings scheint mir das Subset nicht ganz sauber zu sein, da bei der Variable, die das Migrationsjahr nach Deutschland beschreibt (immiyear) bei ca. jedem zehnten Fall vor 2013 liegt (in einem Fall sogar bei 1984). Die Geflüchteten-Befragungen sind jedoch dadurch gekennzeichnet, dass die Befragten frühestens 2013 nach Deutschland kamen. Gibt es dafür eine schlüssige Erklärung? Oder ist es doch sinnvoller den Datensatz ppathl und bioimmig nach Fluchterfahrung (arefback == 5) zu mergen?

Viele Grüße
Felicia

Liebe Felicia,
Die Stichproben M3-6 sind gezogen worden anhand einer Befragungsperson. Da wir dann den gesamten Haushalt befragen, kann es sein, dass die Kriterien für die Ziehungsperson stimmen, jedoch der Partner/ die Partnerin früher in Deutschland ankam. Oder sogar schon immer in Deutschland gelebt hat. Daher haben wir in den Samples auch frühere Zuzugsjahre. Arefback ist eine von uns geprüfte und generierte Variable, die sehr genau die Fluchterfahrung dokumentiert, auch hier können und werden auch dann frühere Zuzugsjahre auftauchen. Daher würde ich sagen, sauberer ist die Identifikation von Menschen mit Fluchthintergrund mit der arefback als über die Sample-Variable.
Viele Grüße
Jana

2 „Gefällt mir“

Liebe Jana, vielen Dank für die schnelle Antwort! Dann ist Arefback wirklich sinnvoller :slight_smile:
LG Felicia

Hallo, nun kam noch eine zweite Frage zu dem IAB-BAMF-SOEP Datensatz auf. Und zwar bin ich, wie oben kurz angemerkt, auch interessiert an den Fragen zur Teilnahme an Integrations- und Sprachkursen. Bisher habe ich die Datensätze ppathl und bioimmig nach Fluchterfahrung (arefback == 5) gefiltert. Um zusätzliche Informationen über den Gesundheitszustand zu integrieren, habe ich den Datensatz dann mit health gemerged. Als letzter Schritt fehlen mir jedoch die Angaben zu den Integrations- und Sprachkursen, die in den M3-M6 Befragungen abgefragt wurden. Gibt es dafür einen extra aufbereiteten Datensatz?
Vielen Dank im Voraus und viele Grüße
Felicia

Hallo Felicia,
du kannst die Variablen zu den Integrations- und Sprachkursen in einer unserer SOEP Dokus finden. Der Titel der Doku ist „A Guide to Using the SOEP for Research on Individuals of Immigrant Origin“. Du kannst die Doku hier runterladen: http://hdl.handle.net/10419/278807
Die Doku befasst sich mit vielen Migrationsthemen und enthält auch eine Excel Tabelle in der du alle Variablen finden kannst, die das SOEP zu einem gewissen Migrationsthema zur Verfügung stellt. Die Excel Tabelle musst du dir über einen Link in der Doku runterladen (z.B. findest du einen Link zu der Excel Tabelle auf Seite 18). Die Variablen zu den Sprach - und Integrationskursen findest du dann in der Kategorie „course attendance“. In der Excel Tabelle wird auch angegeben, in welchem Datensatz sich die jeweilige Variable befindet.
Ich hoffe das hilft dir weiter.
Viele Grüße,
Miriam

2 „Gefällt mir“

Danke Miriam, das hilft sehr weiter! Tatsächlich habe ich es intuitiv sehr ähnlich gelöst, wie dort beschrieben aber es ist eine sehr gute Quelle, um alles nochmal abzugleichen. Eine letzte Frage bleibt mir noch: Mir ist in den Daten aufgefallen, dass die Antworten-Zahlen 2022 sehr gering sind und viele N/As enthalten. Gibt es dafür einen spezifischen Grund? Sind die Daten u.U. noch nicht in die Datensätze integriert worden? LG Felicia

Liebe Felicia,
Weil das SOEP eine sehr große Anzahl an Befragungsjahren, Variablen, Datensätzen und Teilsamples enthält kann ich die Frage nicht generell beantworten. Du müsstest das was dir aufgefallen ist genauer beschreiben. Also zum Beispiel auf welche Variable und welchen Datensatz du dich beziehst; im Vergleich zu welchem Jahr oder welcher anderen Variable dir die Fallzahlen geringer vorkommen; was genau du mit „sehr gering“ meinst und welche Missings du als N/A bewertest.
Viele Grüße