Variable zum Beruf (pgisco08)

Liebe Kolleginnen und Kollegen,

ich habe eine Frage zu der Variablen „pgisco08“ aus dem Datensatz „pgen“.

Diese enthält Informationen zum aktuell ausgeübten Beruf nach der ISCO08.

In den Jahren 2022 und 2023 enthält diese einen sehr hohen Anteil fehlender Werte.

Vor allem der Missingcode „-2“ kommt sehr viel häufiger vor als in den Vorjahren.

Anhand des folgenden STATA-Codes lässt sich das leicht mit den Originaldaten nachvollziehen:

use ${MY_IN_PATH}pgen.dta

recode pgisco08 100/9999=100

tabulate pgisco08 syear if syear>2015 & pglfs==11, col nof

Der Anteil fehlender Werte liegt 2022 bei rund 41 und 2023 bei etwa 34%. In den Vorjahren sind es deutlich weniger.

Ist dieses Problem schon bekann und kann evtl. jemand etwas dazu sagen. Ich frage mich, ob die Variable überhaupt sinnvoll ausgewertet werden kann. Ich habe mal gehört, dass es einen Wechsel bei Befragungsinstitut gab und seitdem Probleme mit der Vercodung der Freitextangaben bei Beruf/Wirtschaftszweig.

In der Dokumentation der generierten Variablen konnte ich hierzu leider nichts finden.

Für jeden Hinweis bin ich sehr dankbar.

Viele Grüße,

Thorsten Kalina

Die Beobachtung ist leider zutreffend.

Eigentlich soll in jedem zweiten Jahr der aktuelle Beruf (und die Branche) für alle Erwerbstätigen erhoben werden. In den Zwischenjahren werden die entsprechenden Fragen nur bei Berufswechsel gestellt. Darüber hinaus sollten Erstbefragte immer über aktuellen Beruf und Branche Auskunft geben. Wenn keine Berufswechsel berichtet werden, erfolgt für die Zwischenjahre dann eine Fortschreibung des aktuellen Berufs in PGEN mit Informationen aus dem Vorjahr.

Durch Fehler bei der Erhebung ist bei den zweijährlichen Vollerhebungen eine Lücke entstanden, gleichzeitig wurden auch die Erstbefragten nicht nach dem aktuellen Beruf gefragt. Das führt dann dazu, dass es weniger gültige Werte für Berufs- und Branchenvariablen (pgisco08, pgkldb2010, pgnace2) als in Vorjahren gibt.

1 „Gefällt mir“