Codierung pl Datensatz

Guten Tag

Ich bin auf der Suche nach der Dokumentation bzw Codebücher für den Datensatz pl, spezifisch einigen Variablen, deren Codierung ich nicht nahvollziehen kann. Ich untersuche den Zeitraum 1990-1997.

Ich habe mich bisher hier orientiert : https://www.diw.de/documents/publikationen/73/diw_01.c.927701.de/diw_ssp1362.pdf. Gibt es aus eine Dokumentation des SOEP-Core? Auf der diw. de Seite werde ich nicht auffindig.

Einige Variablen des Datensatzes pl werden in 1 oder 0 oder eine Kombination dessen erfasst, ich kann jedoch nicht die Bedeutung dafür ausmachen und weiss nicht wie sie in R zu interpretieren sind. Auch die Orientierung auf paneldaten.org und Fragebögen haben mir nicht weitergeholfen. Gibt es irgendwo eine Hilfestellung zur Leseart dieser Codierung?

Hier zum Beispiel die Variable pab0005 zu „Retired Jan-Dec Prev. Yr“

Vielen Dank für eine Antwort!
R. Acosta

Hallo R. Acosta,

Dabei handelt es sich um Kalendariumsvariablen.
Hier haben die Befragten jeweils für 12 Monate monatsgenau angegeben, welcher „Zustand“ auf sie im Vorjahr zugetroffen hat.
Siehe z.B. für 2019 hier:
(https://paneldata.org/soep-core/instruments/soep-core-2019-p-m345-wieder/Q249)

Das wurde dann in Strings gepackt, die leider kaum jemand versteht.
Vermutlich wäre es besser, wenn Du dir mal den Datensatz „pkal“ anschaust:
(https://paneldata.org/soep-core/datasets/pkal/)
Darin gibt es einzelne Variablen zu jedem Monat, anstatt dieser Strings.
Siehe z.B. für Rente/Pension/Vorruhestand im Januar 2019 hier:
(https://paneldata.org/soep-core/datasets/bkpkal/bkp1e001)

Liebe Grüße
Philipp

1 Like