Personen im Jugendfragebogen unterteilen nach Wohnort Ost- oder Westdeutschland

Guten Tag,
Ich arbeite gerade an meiner Arbeit zur HRQoL (SF-12) von Personen in Ost- und Westdeutschland im Übergang vom Jugend- ins Erwachsenenalter. Hierfür möchte ich diejenigen Personen filtern, die 2007 am Jugendfragebogen und 2008 am Individualfragebogen teilgenommen haben. Das habe ich insofern gemacht, dass ich beide Wellen (xjugend und yp) kombiniert und in ein „wide“-Format umgewandelt habe und die Personen übernommen habe, für die in beiden Erhebungen Werte vorliegen (n = 307). Ob diese Personen in den neuen oder alten Bundesländern geboren sind, habe ich dem Item xj61 (in Deutschland geboren Ost/West) entnommen.

Bei meiner Betrachtung soll es hauptsächlich um eine Differenzierung zwischen einem Aufwachsen in Ost oder West gehen weswegen ich zusätzlich die Information benötige, wo die Proband*innen 2007 beim Jugendfragebogen oder 2008 im Erwachsenenfragebogen gelebt haben (Ob in den neuen oder alten Bundesländern). Da ich noch keinen Weg gefunden habe, diese Information in meinen Datensatz einzuarbeiten, wollte ich hier einmal nach Ideen oder Tipps fragen. Also insbesondere wo ich diese Information überhaupt finde.

Da ich das erste Mal mit so umfangreichen Daten wie dem SOEP arbeite, bin ich natürlich auch offen für andere Tipps oder Hinweise falls ich in meinem bisherigen Vorgehen Fehler gemacht habe :slight_smile:

Vielen Dank und Liebe Grüße
Simon

Guten Tag Simon,
Vielen Dank für die Nutzung des Forums und die Beschreibung deiner Frage.

Hast Du dir schon mal den „regionl“-Datensatz angesehen? :wink:
Darin gibt es die Variable „bula“, die dir das Bundesland des Wohnortes anzeigt:
https://paneldata.org/soep-core/datasets/regionl/bula

Liebe Grüße
Philipp

Guten Tag Philipp,
erstmal vielen Dank für deine schnelle Hilfe. Tatsächlich bin ich auf den „regionl“ Datensatz dank einem bereits schon verfassten Foreneintrages gestoßen. Dort gibt es ja sogar die Variable „bula_ew“ die direkt in Ost/West unterteilt. Allerdings erschließt sich mir nicht so recht das Jahr aus dem diese Information stammt. Die in „regionl“ erfassten Erhebungsjahre meiner Kohorte variieren stark, so dass ich nicht ganz verstehe wie ich konkret den Wohnort in z.B. 2008 herausfinde. Vielleicht verstehe ich die Variable aber auch falsch… Vielen Dank für deine Hilfe

Beste Grüße
Simon

Hallo Simon,
Die Information zum Wohnort ist für jedes Jahr vorhanden, in dem ein Haushalt an der Befragung teilgenommen hat und wird jährlich aktualisiert.
Der „regionl“-Datensatz ist ein long/längsschnitt-Datensatz auf Haushaltsebene. Darin sind also die Wohnortinformationen aus allen Befragungsjahren enthalten.
Kombiniert mit der „syear“ Variable siehst Du den Wohnort im gewünschten Befragungsjahr.
Also wenn Du zb syear==2008 angibst, siehst Du die Wohnortinformation des Haushalts im Befragungsjahr 2008.
Gegebenenfalls kann mein Kollege @j.goebel mich noch ergänzen oder korrigieren.

Liebe Grüße
Philipp

Kleine (aber wichtige Ergänzung): da der regionl Datensatz ein long Datensatz (mehrere Jahre) auf der Haushaltsebene ist, muss ein merge mit der hid und der Variable zum Erhebungsjahr (syear) durchgeführt werden. Am besten bevor der Analysedatensatz in das wide Format überführt wird.

Vielen Dank euch beiden! Das es ja ein „long“ Datensatz ist hab ich total vergessen beim ersten anschauen… Deswegen kam beim kombinieren der Datensätze nach der vorherigen Umwandlung in ein „wide“ Format anhand der „cid“ wohl nichts vernünftiges bei rum.

Ich habe diesmal erst regionl nach dem Jahr 2007 gefiltert und diese Daten anschießend mit denen der Personen aus dem Jugendfragebogen verknüpft und als letzten Schritt erst das ganze in ein „wide“-Format umgewandelt. Sieht aus als hätte alles geklappt :slight_smile: Echt cool dass es dieses Forum gibt

Beste Grüße
Simon

1 „Gefällt mir“

Guten Tag liebes SOEP Team,

ich dachte mir mal ich schreibe einfach hier meine Frage statt eine neue Diskussion zu starten. Für meine Betrachtung wäre es vor dem Hintergrund der Bedeutung von sozialer Ungleichheit auf die Gesundheit wichtig, für den sozio-ökonomischen Status statistisch zu kontrollieren. Ich habe in den SOEP-Datensätzen geschaut aber noch keinen Indikator für den SES gefunden (der sich für die Jugendlichen anwenden lässt).
Daher meine Frage: Gibt es im SOEP-Core-Datensatz irgendwo einen berechneten, kategorialen SES für die einzelnen Personen oder Haushalte? Oder wird eine derartige Einteilung nicht vorgenommen?

Ich nutze Daten aus dem Jugendfragebogen und hätte daher ein Interesse daran, wie die Haushalte in denen die Personen aufgewachsene sind bzw. ihre Eltern sozio-ökonomisch dastehen. Statt des SES würden sich auch die soziale Schicht, der soziale-Status oder ähnliche Variablen eignen, die ich leider ebenfalls im SOEP noch nicht ausfindig machen konnte. Vielleicht habe ich die entsprechenden Indikatoren auch einfach bisher übersehen. Schonmal Vielen Dank für jede Art der Hilfe oder Hinweise :slight_smile:

Beste Grüße
Simon

Hallo Simon,
im SOEP gibt es keine fertige Variable die den SES misst. Aber es gibt die Input Variablen dafür im pgen Datensatz (Bildung und Berufsprestige und Berufsklassifikationen) und im hgen Datensatz (Monatshaushaltseinkommen) oder pequiv Datensatz (Vorjahreshaushaltseinkommen). Wie das dann genau zusammengesetzt wird ist abhängig von der Forschungsfrage. ich würde wahrscheinlich Bildung, Beruf und Einkommen in drei separaten Variablen nutzen.
Außerdem stellt sich auch die Frage, soll das jeweils nur individuell gemessen werden oder soll es eine Klassifikation des Haushaltes sein.

Grüße,
Jan

1 „Gefällt mir“

Hallo Jan,
Danke für deine Rückmeldung und die Aufklärung über die SES-Variablen im SOEP.

Zu deinem Hinweis ob ich den SES auf Individual- oder Haushaltsebene betrachten möchte: Da ich mir die 16-17 jährigen Personen anschaue, bin ich davon ausgegangen, dass eine Betrachtung auf Haushaltsebene mehr Sinn macht. Dann werde ich dies wohl hauptsächlich auf Basis des Haushaltseinkommens machen. Nochmals Vielen Dank.

Liebe Grüße

Simon