Pgemplst & pglfs

Hallo,
ich fokussiere mich in meiner Analyse auf Migranten und Flüchtlinge mit direktem Migrations - bzw. Flüchtlingshintergrund zwischen 2013 - 2021. Außerdem schaue ich mir nur Personen mit abgeschlossenem Interview an und die zwischen 18 und 64 Jahre alt sind. Observations mit fehlenden Angaben für corigin, immiyear und pgisced11 wurden ebenfalls ausgeschlossen.

Ich würde gerne eine Dummy Variable erstellen, die 1 = working/employed und 0 andernfalls. Dabei ist mir aufgefallen, dass es einige Observations gibt die gem. pglfs = erwerbstätig sind aber gem. pgemplst = nicht erwerbstätig (NE) sind. Z.B. habe ich eine Person gefunden, die von 2013 - 2017 im Panel ist. 2013 - 2015 pglfs = erwerbstätig und pgemplst = Vollzeit. In 2016 pglfs = erwerbstätig aber pgemplst = NE. In 2017 pglfs = erwerbstätig und pgemplst = Vollzeit. Ein ähnliches Szenario habe ich für einige observations die gem. pglfs = erwerbstätig aber gem. pgemplst = NE sind. Ich verstehe leider nicht so ganz wie das sein kann, und ob ich diese Observations als working/employed oder nicht einordnen sollte. Könnten sie mir bitte helfen das zu verstehen?

Ich hoffe mein Anliegen ist klar und nicht zu verwirrend.

LG Anna

Hallo Anna,

diese Inkonsistenzen in den Variablen zum Erwerbsstatus sind uns bekannt und sie entstehen dadurch, wie mit denjenigen verfahren wird, die in der Frage zur Erwerbstätigkeit (Variable plb0022_h im Datensatz pl) die Kategorie „Altersteilzeit mit Arbeitszeit Null“ angeben. Bei pgemplst werden sie als arbeitslos gezählt, während sie bei lfs als erwerbstätig zählen. Da diese Beobachtungen einen gewissen Zwischenstatus haben, hängt es von Ihrem konkreten Vorhaben ab, wie Sie damit umgehen wollen. Ggf. kann es dabei hilfreich sein die Hauptinputvariable plb0022_h heranzuziehen.

Generell entstehen Inkonsistenzen zwischen pglfs und pgemplst dadurch, dass erstere Variable in jeder Welle für alle Jahre auf Neue generiert wird, während pgemplst nur für das aktuelle Jahr generiert wird und sozusagen an die vorherigen Generierungen unten drangehängt wird. Um konsistent über die Jahre zu bleiben, führt das dazu, dass wir bei pgemplst keine großen Änderungen in den Annahmen durchführen können, bzw. es eine ältere Version des Fragebogens widerspiegelt. Dagegen können wir mit pglfs etwas flexibler sein.

Ich hoffe damit konnte ich etwas weiterhelfen.

Liebe Grüße
Mattis

2 Likes

Hallo Mattis,

vielen Dank für die schnelle und hilfreiche Antwort.

Ich habe die Variable plb0022_h angeschaut und dabei festgestellt, dass auch Personen unter 55 Jahren diese Angabe machten (18-53 Jahre). Ist dies möglicherweise eine falsche Angabe der Befragten?

Wenn ich es also richtig verstehe ist pglfs eine „neuere“ Variable, die eher den tatsächlichen Erwerbsstatus widerspiegelt?

Liebe Grüße
Anna

Hallo Anna,

ja bei jüngeren Beschäftigten kann es sich dann möglicherweise um fehlerhafte Angaben durch die Befragten handeln.

pglfs ist Stand jetzt die flexiblere Variable, bei der es einfacher ist Änderungen im Fragebogen abzubilden. Ich würde aber vermutlich eine Grundsatzentscheidung treffen, wie mit den Personen in der Kategorie „Altersteilzeit mit Arbeitszeit Null“ umgegangen werden soll.

2 Likes

Hi Mattis,

vielen Dank für deine Hilfe.
Ich werde gemeinsam mit meinem Supervisor schauen wie wir damit umgehen werden.

Liebe Grüße
Anna