Arbeitslosigkeit und Erwerbstätigkeit

Leonie · 4. Februar 2020 um 15:35

Liebes NEPS-Forum,

ich benutze unter anderem den Basics Datensatz für meine Arbeit. Hier interessiere ich mich für die Variablen tx29060 (momentan erwerbstätig ja/nein) und tx29080 (momentan arbeitslos: ja/nein) zum Interviewzeitpunkt.

Was mich wundert ist, dass die Arbeitslosenquote viel kleiner ist als die Erwerbslosenquote. In meinem Beispiel ist die ELQ bei 13%, die ALQ aber nur bei 7.5 %. Warum? Laut Definitionen sollte es ja eher umgekehrt der Fall sein.

Wenn ich mir eine Kreuztabelle anzeigen lasse, erhalte ich so etwas:

Ich verstehe hier die Kombination nein/nein nicht. Denn wenn jemand erwerbslos ist, ist diese Person doch auch arbeitslos. Oder geht es hier um Leute, die zwar erwerblos, aber nicht arbeitslos gemeldet sind?

Vielen Dank schon einmal für Eure Hilfe.

Viele Grüße,

Leonie

tobias.koberg · 5. Februar 2020 um 09:00

Hi Leonie,

ich würde dir empfehlen, den Basics-Datensatz nur eingeschränkt zu benutzen. Die Informationen dort sind stark vereinfacht. Versuche die Information lieber aus den Spell-Modulen (hier spEmp) zu aggregieren.

Zum Unterschied zwischen Arbeitslosigkeit und Erwerbslosigkeit siehe z.B. hier (externer Link).

Alles Gute,
Tobias

Ralf_Kuenster · 19. Februar 2020 um 13:08

Liebe Leonie,

grundsätzlich gehören zu den Erwerbslosen alle Personen, die aktuell keine Erwerbstätigkeit haben. Technisch gesehen bedeutet das, dass die Person keine andauernde Episode im Längsschnittfile spEmp aufweist. Als arbeitslos zählt eine Person, wenn sie explizit angegeben hat, zum Interviewzeitpunkt arbeitslos zu sein. Diese Person hat also eine andauernde Episode im Längsschnittfile spUnEmp. Die arbeitslosen Personen zählen natürlich auch zu der Gruppe der Erwerbslosen, sofern sie nicht gleichzeitig (und das ist durchaus möglich) eine aktuelle Erwerbstätigkeit in spEmp aufweisen. Darüber hinaus gibt es jedoch eine große Anzahl von Personen, die weder erwerbstätig noch arbeitslos sind, etwa Personen in Ausbildung, in Rente, oder andere Nichterwerbstätige, die weder beabsichtigen eine Erwerbstätigkeit aufzunehmen, noch sich als arbeitslos bezeichnen (Hausfrau/-mann, Elternzeit, längere Krankheit usw.). Insofern sollte die Gruppe der Erwerblosen tatsächlich deutlich größer sein, als die Gruppe der Arbeitslosen.

Viele Grüße, Ralf.

Leonie · 20. Februar 2020 um 17:16

Lieber Ralf, lieber Tobias,

herzlichen Dank für eure hilfreichen Antworten.

In meiner Analyse möchte ich Erwerbspersonen und solche Personen einbeziehen, die grundsätzlich arbeiten können, aber keine Aufnahme beabsichtigen (wie z.B. Hausfrauen und –männer). Also ich möchte jene droppen, die in Elternzeit, Ausbildung, arbeitsunfähig oder in Rente sind, da diese ja quasi von der Arbeit „verhindert“ sind.

Meine Frage ist nun: Wie kann ich feststellen, aus welchem Grund eine Nichterwerbsperson nicht erwerbstätig ist? Ich habe mir gedacht, dass das vielleicht mit Biography geht, indem ich sptype und splast anschaue und dann die Typen droppe, die ich nicht drin haben möchte (z.B. ParLeave oder Internship) und die zudem andauern. Hier gibt es aber keine Information über Hausfrauen/ -männer oder Kranke. Geht das vielleicht dann über die spGap-Daten mit der Variable „Art der Lücke?“

Danke schon einmal und viele Grüße,

Leonie

Ralf_Kuenster · 24. Februar 2020 um 12:40

Liebe Leonie,

die Auswahl der Personen festzulegen, die du in deine Analyse einbeziehen willst, ist nicht ganz trivial. Würden wir davon ausgehen, dass jede Person nur eine einzige andauernde Episode in Biography aufweist, dann könntest du so vorgehen, wie du dir das gedacht hast, also:

in Biography nur die Episoden beibehalten, die andauern und dann alle Episoden droppen, deren sptype du nicht benötigst.

Da du jedoch zusätzlich nach unterschiedlichen spGap-Typen differenzieren möchtest, müsstest vorher die Informationen aus spGap an Biography mergen.

Hier eine kurze Stata-Syntax dazu:

use „SC6_spGap_D_10-0-1.dta“, clear
keep if subspell == 0
save " SC6_spGap_D_10-0-1_sub0.dta", replace
use " SC6_Biography_D_10-0-1.dta", clear
merge 1:1 ID_t splink using " SC6_spGap_D_10-0-1_sub0.dta"
drop if _merge == 2
keep if splast == 1

Ab hier könntest du dann nach Episodentyp und Gap-Typ auswählen, weil du nun auch die Informationen zum Gap-Typ in Variable ts29101 in Biography zur Verfügung hast.

Leider gibt es jedoch nicht wenige Befragte, die zum letzten Interviewzeitpunkt mehrere Dinge gleichzeitig machen. Im aktuellen SC6-SUF gibt es innerhalb der insgesamt 17124 Befragten 3020 Befragte, die mehr als eine andauernde Episode angeben. In den Daten finden sich Extremfälle, die bis zu 6 andauernde Episoden angegeben haben. Bei Fällen, die mehr als eine andauernde Episode aufweisen, musst du auswählen, welche von diesen andauernden Episoden für dich die für deine Analysen relevante sein soll. So gibt es z.B. 150 Personen, die angeben sowohl eine andauernde Erwerbsepisode als auch eine andauernde Arbeitslosigkeitsepisode zu haben. Hier stellt sich die Frage, ob die Erwerbstätigkeit oder die Arbeitslosigkeit für dich wichtiger ist, oder ob die Erwerbstätigkeit erst dann relevanter als die Arbeitslosigkeit ist, wenn sie einen bestimmten zeitlichen Umfang übersteigt. Im letzteren Fall müsstest du zusätzliche Informationen zum zeitlichen Umfang der Erwerbstätigkeit aus spEmp in die Daten mit aufnehmen, die du für deine Selektionsentscheidung nutzt. Diese Information könnte jedoch wiederum verteilt sein über mehrere Erwerbsepisoden, da 1533 Fälle mehr als eine aktuelle Erwerbsepisode angeben.
Darüber hinaus gibt es beispielsweise 216 Personen, die eine aktuelle Erwerbstätigkeit und eine aktuelle Elterzeit haben.

Grundsätzlich löst man solche Probleme, bei denen mehrere Episoden infrage kommen und man sich für eine entscheiden muss, durch Priorisierung der Episoden nach Episodenarten oder/und Konstellationen von Episodeneigenschaften. Dazu bildet man einen Prioritätsindex, der umso höher ist, je relevanter bestimmte Episodeneigenschaften für die Selektion sind. Letztlich selektierst du dann, wenn eine befragte Person mehrere Episoden hat, diejenigen Episode als die für dich relevante, die von dir den höchsten Prioritätsindex bekommen hat.

Viele Grüße, Ralf.