Arbeitslosigkeit in pTarget in Welle 4 und 5

Liebe KollegInnen,

vermutlich habe ich irgendwas relevantes übersehen, nur weiß ich leider noch nicht was und wo.

Wenn ich das codebook zu pTarget für SC6 ansehe, und darin insbesondere die Variable ts25101 (Arbeitslosigkeit seit der letzten Befragung) dann hat es für mich den Anschein, als ob von Welle 4 zu Welle 5 rund 90% derjenigen, die arbeitslos waren, das Sample verlassen haben: arbeitslos in Welle 4 sind 3050 und  in Welle 5 sind es nur 369, wobei sich die Anzahl der Nichtarbeitslosen und der fehlenden Werte  um zusammen etwa 300 ändert. Was ist mit den Arbeitslosen passiert?

Vielen Dank.

Susanne

 

Hallo Susanne,
ich bin mir nicht sicher, ob wir hier von übersehen sprechen können; zumindest ist der Befragungsverlauf auch in diesem Punkt ein wenig komplizierter, als es die einfache Kreuztabelle im Codebook wiedergeben kann.

Die Frage zur Variable ts25101 lautet: „Waren Sie seit <Interviewdatum der letzten Befragung> arbeitslos?“. Soweit siehst du das auch im Codebook; allerdings ist das nur die halbe Wahrheit. Was die Tabelle schwer zu interpretieren macht, ist der Umstand, dass (a) sich die Frage nicht auf den aktuellen Erwerbsstatus bezieht (das will ich hier nur zur Klarstellung erwähnt habe) und (b) der Bezugszeitraum von Befragtem zu Befragten unterschiedlich ist – insbesondere vor dem Hintergrund von Erst- und Panelbefragten.

Wie dir sicher bewusst ist, wurde für die NEPS-Startkohorte 6 das ursprüngliche Sample der IAB-Befragung „Arbeiten und Lernen im Wandel (ALWA)“ übernommen und um eine Auffrischungs- sowie Aufstockungsstichprobe ergänzt. Es sind diese Neubefragten, die die Tabelle schwer interpretierbar machen; denn ein erstmalig in NEPS Befragter wird natürlich nicht nach seiner Arbeitslosigkeitserfahrung seit dem letzten Interview gefragt, sondern nach seiner Arbeitslosigkeitserfahrung insgesamt („Waren Sie irgendwann einmal arbeitslos?“).

Kombiniert man den Indikator dafür, wann eine Person in die NEPS-Befragung gestartet ist (tx80107 aus CohortProfile) mit einer Kreuztabelle aus wave und ts25101, so zeigt sich, dass nur 320 der Panelbefragten in Welle 4 eine Arbeitslosigkeit im Vergleich zur Vorwelle berichten; 2730 der Erstbefragten in der gleichen Welle hingegen berichten, überhaupt schon einmal Erfahrungen mit Arbeitslosigkeit gemacht zu haben.

In Stata sieht eine entsprechend aus dem Bauch geschossene Syntax dafür so aus:

* open pTarget
nepsuse pTarget , cohort(SC6) version(8.0.0)
* merge indicator representing individual first wave from CohortProfile 
merge 1:1 ID_t wave using `"`=subinstr(`"`c(filename)'"',"pTarget","CohortProfile",.)'"' , ///
 keepusing(tx80107) keep(match) assert(match using) nogenerate
* generate dummy for first interview per person
generate firstint=(tx80107==wave)
* crosstabulate
bysort firstint : tabulate wave ts25101 , missing

Ergebnis:

--------------------------------------------------------
-&gt; firstint = 0

                      ,                     Arbeitslosigkeit ja/nein
          Panel-Welle , weiß nich  Angabe ve  designbed         ja       nein          . ,     Total
----------------------+------------------------------------------------------------------+----------
2009/2010 (1. NEPS-Ha ,         0          0      6,495          0          0          0 ,     6,495 
2010/2011 (2. NEPS-Ha ,         0          0      9,322          0          0          0 ,     9,322 
2011/2012 (3. NEPS-Ha ,         3          1          0        320      8,023        557 ,     8,904 
2012/2013 (4. NEPS-Ha ,         0          3          0        369     10,643        681 ,    11,696 
2013/2014 (5. NEPS-Ha ,         2          0          0        308      9,724        605 ,    10,639 
2014/2015 (6. NEPS-Ha ,         1          0          0        342      8,882        545 ,     9,770 
2015/2016 (7. NEPS-Ha ,         2          2          0        308      8,450        474 ,     9,236 
----------------------+------------------------------------------------------------------+----------
                Total ,         8          6     15,817      1,647     45,722      2,862 ,    66,062 

--------------------------------------------------------
-&gt; firstint = 1

                      ,                Arbeitslosigkeit ja/nein
          Panel-Welle , weiß nich  Angabe ve  designbed         ja       nein ,     Total
----------------------+-------------------------------------------------------+----------
     2007/2008 (ALWA) ,         0          0      6,778          0          0 ,     6,778 
2009/2010 (1. NEPS-Ha ,         0          0      5,154          0          0 ,     5,154 
2011/2012 (3. NEPS-Ha ,        19          7          0      2,730      2,452 ,     5,208 
----------------------+-------------------------------------------------------+----------
                Total ,        19          7     11,932      2,730      2,452 ,    17,140 




Ich hoffe, das klärt den Zusammenhang ein wenig auf. Leider ist es in der blanken Zweidimensionalität des PDF-Codebooks nicht abbildbar, die unterschiedlichen Frage-Quellen für eine solche Filtervariable vollständig abzubilden; stattdessen präsentiert das Codebook die aktuellste Fragestellung – und das ist die, die in der Wiederholungsbefragung eingesetzt wird, denn Erstbefragte gibt es seit einigen Wellen in der Startkohorte 6 nicht mehr.

So oder so gilt die generelle Empfehlung: Wenn du dich für den zum jeweiligen Erhebungszeitpunkt gültigen Erwerbsstatus einer Person interessierst, solltest du einen Blick in die Episodendaten werfen. Die sind notwendigerweise komplexer, enthalten aber deutlich mehr Information über Zustände.

Beste Grüße
Bela