Hallo Susanne,
ich bin mir nicht sicher, ob wir hier von übersehen sprechen können; zumindest ist der Befragungsverlauf auch in diesem Punkt ein wenig komplizierter, als es die einfache Kreuztabelle im Codebook wiedergeben kann.
Die Frage zur Variable ts25101 lautet: „Waren Sie seit <Interviewdatum der letzten Befragung> arbeitslos?“. Soweit siehst du das auch im Codebook; allerdings ist das nur die halbe Wahrheit. Was die Tabelle schwer zu interpretieren macht, ist der Umstand, dass (a) sich die Frage nicht auf den aktuellen Erwerbsstatus bezieht (das will ich hier nur zur Klarstellung erwähnt habe) und (b) der Bezugszeitraum von Befragtem zu Befragten unterschiedlich ist – insbesondere vor dem Hintergrund von Erst- und Panelbefragten.
Wie dir sicher bewusst ist, wurde für die NEPS-Startkohorte 6 das ursprüngliche Sample der IAB-Befragung „Arbeiten und Lernen im Wandel (ALWA)“ übernommen und um eine Auffrischungs- sowie Aufstockungsstichprobe ergänzt. Es sind diese Neubefragten, die die Tabelle schwer interpretierbar machen; denn ein erstmalig in NEPS Befragter wird natürlich nicht nach seiner Arbeitslosigkeitserfahrung seit dem letzten Interview gefragt, sondern nach seiner Arbeitslosigkeitserfahrung insgesamt („Waren Sie irgendwann einmal arbeitslos?“).
Kombiniert man den Indikator dafür, wann eine Person in die NEPS-Befragung gestartet ist (tx80107 aus CohortProfile) mit einer Kreuztabelle aus wave und ts25101, so zeigt sich, dass nur 320 der Panelbefragten in Welle 4 eine Arbeitslosigkeit im Vergleich zur Vorwelle berichten; 2730 der Erstbefragten in der gleichen Welle hingegen berichten, überhaupt schon einmal Erfahrungen mit Arbeitslosigkeit gemacht zu haben.
In Stata sieht eine entsprechend aus dem Bauch geschossene Syntax dafür so aus:
* open pTarget
nepsuse pTarget , cohort(SC6) version(8.0.0)
* merge indicator representing individual first wave from CohortProfile
merge 1:1 ID_t wave using `"`=subinstr(`"`c(filename)'"',"pTarget","CohortProfile",.)'"' , ///
keepusing(tx80107) keep(match) assert(match using) nogenerate
* generate dummy for first interview per person
generate firstint=(tx80107==wave)
* crosstabulate
bysort firstint : tabulate wave ts25101 , missing
Ergebnis:
--------------------------------------------------------
-> firstint = 0
, Arbeitslosigkeit ja/nein
Panel-Welle , weiß nich Angabe ve designbed ja nein . , Total
----------------------+------------------------------------------------------------------+----------
2009/2010 (1. NEPS-Ha , 0 0 6,495 0 0 0 , 6,495
2010/2011 (2. NEPS-Ha , 0 0 9,322 0 0 0 , 9,322
2011/2012 (3. NEPS-Ha , 3 1 0 320 8,023 557 , 8,904
2012/2013 (4. NEPS-Ha , 0 3 0 369 10,643 681 , 11,696
2013/2014 (5. NEPS-Ha , 2 0 0 308 9,724 605 , 10,639
2014/2015 (6. NEPS-Ha , 1 0 0 342 8,882 545 , 9,770
2015/2016 (7. NEPS-Ha , 2 2 0 308 8,450 474 , 9,236
----------------------+------------------------------------------------------------------+----------
Total , 8 6 15,817 1,647 45,722 2,862 , 66,062
--------------------------------------------------------
-> firstint = 1
, Arbeitslosigkeit ja/nein
Panel-Welle , weiß nich Angabe ve designbed ja nein , Total
----------------------+-------------------------------------------------------+----------
2007/2008 (ALWA) , 0 0 6,778 0 0 , 6,778
2009/2010 (1. NEPS-Ha , 0 0 5,154 0 0 , 5,154
2011/2012 (3. NEPS-Ha , 19 7 0 2,730 2,452 , 5,208
----------------------+-------------------------------------------------------+----------
Total , 19 7 11,932 2,730 2,452 , 17,140
Ich hoffe, das klärt den Zusammenhang ein wenig auf. Leider ist es in der blanken Zweidimensionalität des PDF-Codebooks nicht abbildbar, die unterschiedlichen Frage-Quellen für eine solche Filtervariable vollständig abzubilden; stattdessen präsentiert das Codebook die aktuellste Fragestellung – und das ist die, die in der Wiederholungsbefragung eingesetzt wird, denn Erstbefragte gibt es seit einigen Wellen in der Startkohorte 6 nicht mehr.
So oder so gilt die generelle Empfehlung: Wenn du dich für den zum jeweiligen Erhebungszeitpunkt gültigen Erwerbsstatus einer Person interessierst, solltest du einen Blick in die Episodendaten werfen. Die sind notwendigerweise komplexer, enthalten aber deutlich mehr Information über Zustände.
Beste Grüße
Bela