Liebe Kolleginnen und Kollegen,
ich habe eine Frage zu der Variablen „pgisco08“ aus dem Datensatz „pgen“.
Diese enthält Informationen zum aktuell ausgeübten Beruf nach der ISCO08.
In den Jahren 2022 und 2023 enthält diese einen sehr hohen Anteil fehlender Werte.
Vor allem der Missingcode „-2“ kommt sehr viel häufiger vor als in den Vorjahren.
Anhand des folgenden STATA-Codes lässt sich das leicht mit den Originaldaten nachvollziehen:
use ${MY_IN_PATH}pgen.dta
recode pgisco08 100/9999=100
tabulate pgisco08 syear if syear>2015 & pglfs==11, col nof
Der Anteil fehlender Werte liegt 2022 bei rund 41 und 2023 bei etwa 34%. In den Vorjahren sind es deutlich weniger.
Ist dieses Problem schon bekann und kann evtl. jemand etwas dazu sagen. Ich frage mich, ob die Variable überhaupt sinnvoll ausgewertet werden kann. Ich habe mal gehört, dass es einen Wechsel bei Befragungsinstitut gab und seitdem Probleme mit der Vercodung der Freitextangaben bei Beruf/Wirtschaftszweig.
In der Dokumentation der generierten Variablen konnte ich hierzu leider nichts finden.
Für jeden Hinweis bin ich sehr dankbar.
Viele Grüße,
Thorsten Kalina