Fragen zur Nutzung der generierten Variable für "Labor Force Status" -pglfs

Dataversion

v40.1

Data Set

SOEP

Please describe your problem

Hallo zusammen,

Ich arbeite derzeit mit den SOEP Daten. Hierbei würde ich gerne die generierte Variable für Labor Force Status (pglfs) nutzen.

Im Codebook zu den Ausprägungen der Variable stehen allerdings unterschiedliche Zeitliche Einschränkungen. Die Ausprägung 4 gilt demnach erst ab 1991; 8 nur zwischen 1985-2016, 9 ab 1999; 10 von 1985 bis 2016; 13 erst ab 2017.

Verstehe ich das richtig, das die Kategorien der Variable über die Zeit nicht konstant sind? Was muss ich beachten wenn ich die Variable von 1990 bis 2024 nutzen möchte? Geht das überhaupt? Besteht nicht ein Problem darin, dass z.B. die Ausprägung „13“ erst ab 2017 existiert? Wo waren Fälle der Ausprägung 13 vor 2017? Was passiert mit Fällen der Ausprägung 8 oder 10 nach 2016? Leider kann ich hierzu nichts im Codebook finden.

Über ein paar Tipps und Hinweise wie diese Variable genutzt werden kann wäre ich ihnen sehr dankbar!

Danke und Viele Grüße

Max

Hallo,

zur allgemeinen Logik der Variable: Die grobe Einteilung in Erwerbstätige (Kategorie 11) und Nicht-Erwerbstätige (Kategorie 1) findet anhand der verschiedenen Versionierungen von plb0022 in pl statt. Sofern weitere Informationen vorhanden sind, erfolgt aufbauend auf der ersten Unterteilung eine Spezifizierung der jeweiligen übergeordneten Kategorie.

Die Einschränkungen bei den genannten Ausprägungen ergeben sich aus Änderungen des Personenfragebogens, die im Laufe der Zeit durchgeführt worden sind:

  • Seit 1991: Erhebung von Angaben zum Mutterschutz (Kategorie 4)
  • Seit 1999: Ermittlung von Angaben zu bezahlten Tätigkeiten innerhalb der letzten sieben Tage (Kategorien 9 und 12)
  • 1985 bis 2016: Bei Nebentätigkeiten wurde zunächst zwischen gelegentlichen (Kategorie 8) und regelmäßigen Nebentätigkeiten (Kategorie 10) unterschieden.
  • Seit 2017: Aktuell wird stattdessen zwischen ehrenamtlichen (ohne lfs-Kategorie) und bezahlten Tätigkeiten (Kategorie 13) differenziert.

Da manche Informationen in älteren Wellen nicht erhoben wurden bzw. in jüngeren Wellen nicht mehr erhoben werden, sind die Ausprägungen der generierten Variable über den Zeitraum 1990 bis 2024 nicht durchgehend vergleichbar. Ein Beispiel: Eine Person, die einer nicht-bezahlten regelmäßigen Nebentätigkeit nachgeht, sonst aber nicht erwerbstätig ist, wird bis 2016 auf die Ausprägung 10 kodiert. Ab 2017 wird eine Person mit diesen Merkmalen auf die Ausprägung 1 kodiert, sofern zu der Person nicht noch weitere Angaben, etwa zu einer Ausbildung oder der Registrierung als arbeitslose Person vorliegen. Die genaue Kodierung hängt also davon ab, ob eine Person zusätzlich zu der allgemeinen Angabe (erwerbstätig oder nicht erwerbstätig) einen weiteren „Treffer“ bei den Zusatzinformationen vorweist – was wiederum von den Zeiträumen abhängt, in denen die Informationen erhoben (bzw. nicht erhoben) wurden.

Wie damit umzugehen ist, hängt natürlich in erster Linie vom jeweiligen Forschungsinteresse ab. Eine Möglichkeit wäre etwa, die Kategorien zu den Nebentätigkeiten zusammenzufassen, wobei vermutlich zusätzliche Informationen für nicht-bezahlte Tätigkeiten ab 2017 herangezogen werden müssten (plc0541, plc0543 und plc0545 in pl), um Vergleichbarkeit herzustellen. Außerdem wäre es beispielsweise möglich, die „störenden“ Kategorien in die nicht-spezifizierte allgemeine Kategorie (1 oder 11) zu integrieren.

Ich hoffe das hilft erst einmal weiter.

Viele Grüße
Frederic

1 „Gefällt mir“