Frage zum Beruf im Herkunftsland

Hallo zusammen, ich suche nach der Variablen des letzten Berufs im Herkunftsland für Geflüchtete und Migranten.

Für Geflüchtete in den Samples M3,4,5,6 & 9 sollte die Variable l_isco08_ljobcor den letzten Beruf abbilden, während lr3033_h angeben sollte, falls die Person keinen Beruf im Herkunftsland hatte. Beide Variablen befinden sich im Datensatz Biol.

Frage Nummer 1: Warum ist für viele Geflüchtete, die angeben, einen Beruf im Heimatland gehabt zu haben, kein Beruf verfügbar?

Um genauer zu sein: Unter den Personen, die in der Erstbefragung angeben, einen Beruf im Herkunftsland gehabt zu haben (i.e. lr3033_h == -2), ist für etwa die Hälfte der Personen kein Beruf in l_isco08_ljobcor angegeben (-2 - trifft nicht zu).

Hier mein Code, um das zu checken (nach Öffnen des biol Datensatzes):

bys pid (year): egen counter = _n

gen occupation = l_isco08_ljobcor
replace occupation = 1 if l_isco08_ljobcor > 0
label define occupation_spec_lb -8 „Frage nicht Teil des Fragebogens“ -2 „trifft nicht zu“ -1 „keine Angabe“ 1 „Occupation specified“
label values occupation occupation_spec_lb

Aus einem
tab lr3033_h occupation if counter == 1 & inlist(sample1, 30,31,34,41,48), m row ergibt sich dann, dass unter denen die zu “War im Herkunftsland nicht berufstätig” “Trifft nicht zu” geantwortet haben, bei 45% der Observationen die occupation variable “trifft nicht zu” ist. Warum ist das so? War es hier nicht möglich, den Beruf zu kodieren?

Frage Nummer 2: Gibt es eine ähnliche Variable auch für Geflüchtete, die früher interviewt wurden und nicht Teil der Samples M3,4,5,6 & 9 sind?

Wäre das die Variable l_isco08_job09?

Vielen Dank schonmal für die Hilfe!

Frage 1:

In den Zeilen bys … und label … waren Syntax-Fehler. Ich habe mal eine Vermutung angestellt, was gemeint gewesen sein könnte. Außerdem war wohl sample 47 (und nicht 48) gemeint,

Die gefühlte Unplausibilität verschwindet, wenn man nur die Fälle anschaut, die tatsächlich in die Frage hereinlaufen. Das entscheidet sich in dieser Frage https://paneldata.org/soep-core/instruments/soep-core-2023-ll-ref/263 und ist abzulesen in der Variable lr3032. Die neue Tabelle in folgendem Skript zeigt eher erwartbare Größenordnungen.

use "\\diw-berlin.de\share\groups\rdc-prod\distribution\soep-core\soep.v40.1\eu\Stata\soepdata\biol.dta", clear
bys pid (syear): gen counter = _n
gen occupation = l_isco08_ljobcor
replace occupation = 1 if l_isco08_ljobcor > 0
label define occupation_spec_lb -8 "Frage nicht Teil des Fragebogens" -2 "trifft nicht zu" -1 "keine Angabe" 1 "Occupation specified"
label values occupation occupation_spec_lb
tab lr3033_h occupation if counter == 1 & inlist(sample1, 30,31,34,41,48) , m row
* Ausschluss der Fälle, die noch nie gearbeitet haben und anders sample.
tab lr3033_h occupation if counter == 1 & inlist(sample1, 30,31,34,41,47)  & lr3032!=1, m row

Alle Fälle mit gültiger occupation haben also eine -2 bei der lr3033, aber umgekehrt gilt nicht, dass immer bei einer -2 in der lr3033 auch eine occupation zu erwarten wäre.

Frage 2:

Die Variable l_isco08_job09 enthält immer nur Angaben zum letzten Beruf vor der Einreise nach Deutschland. Dieser Tätigkeit war dann keine im Herkunftsland.

Hallo Knut!

Vielen Dank für die Antwort, das war sehr hilfreich!

Ich hätte zwei kurze Rückfragen:

Zu Frage 1: Ich wollte tatsächlich sample 47 & 48 inkludieren, da beide ja Geflüchteten Samples sind, richtig? Sample 48 sind Ukrainer, und wenn ich diese in das tab inkludiere bekomme ich wieder recht viele Personen mit lr3033_h = -2 und occupation “trifft nicht zu”. Warum gilt umgekehrt hier nicht, dass bei einer -2 in der lr3033 auch eine occupation zu erwarten wäre? Wurden die Ukrainer nicht nach ihrem Beruf im Herkunftsland befragt?

Zu Frage 2: “Dieser Tätigkeit war dann keine im Herkunftsland.” Was heißt das genau? Ist l_isco08_job09 also eine Tätigkeit vor Einreise, aber in einem anderen Land als dem Herkunftsland?

Herzlichen Dank im Voraus nochmal!

zu 1: Korrekt, die Ukrainer haben die Frage nicht bekommen. Das sieht man an diesem Eingangsfilter im Fragebogen:

Quelle: https://paneldata.org/soep-core/instruments/soep-core-2023-ll-ref/266

Und das ist eben auch einer der Fälle, wo lr3032 -2 wird und es trotzdem keine Berufsangabe gibt.

Es ist i.d.R. nicht möglich, die Daten zu verstehen, wenn man ausschließlich den Datensatz anschaut. Ein Blick in die Erhebungsinstrumente ist häufig unerlässlich.

zu 2: Korrekt. Das sind Tätigkeiten vor der Einreise aber außerhalb des Herkunftslandes. Auch hier hilft nur ein Blick in den Fragebogen und die Filter.

Lieber Knut,

danke nochmals für die schnelle Antwort! Mein Problem ist, dass ich unter dem Link zum Instrument die Filter nicht sehe (ich hänge einen Screenshot an). Was mache ich denn falsch?

Der Filter wird als Tooltip angezeigt, wenn der Mauszeiger über das blaue Icon mit dem blauen Pfeil links oben bewegt wird.