Frage zu Missing Codes der Variable ple0036 im pl-Datensatz

Guten Tag,

ich habe eine Frage zu der Variable “ple0036” (Aussage zu “Leiden an chronischen Krankheiten: ja/nein”). Ich habe diese Variable aus dem pl-Datensatz für das Jahr 2018 gefiltert und bin etwas stutzig, dass diese Variable so viele Zeilen (insg. 4516) mit dem Missing Code -5 ausgibt. Dieser steht ja für “Frage nicht inbegriffen in dieser Fragebogen Version”. Nun habe ich mich gefragt, wie es sein kann, dass innerhalb eines Erhebungsjahres unterschiedliche Versionen verwendet wurden. Oder ist dies Folge der unterschiedlichen Samples A-N?

Vielen Dank im Voraus!

Liebe Grüße,

Luisa

Hallo Luisa,

tatsächlich ist es in den meisten Erhebungsjahren so, dass unterschiedliche Fragebogenversionen für verschiedene Subsamples eingesetzt werden, beispielsweise für erstmalig befragte Personen, für Befragte aus der ehemaligen DDR oder für spezielle Stichproben wie Geflüchtete und Migrantinnen/Migranten.

Welche Version eine Person erhalten hat, kannst du seit 2016 anhand der Variable instrument erkennen.
Zusätzliche Hinweise finden sich auch in den Variablennamen der querschnittlichen Datensätzen:

  • in jüngeren Jahrgängen beispielsweise durch ein Suffix _q*(siehe wuqiq-Schema in SOEPcompanion)
  • in älteren Datensätzen häufig durch Endungen wie o oder r.

Wenn man ple0036 mit der Variable instrument kreuz tabelliert, zeigt sich, dass insbesondere Befragte aus dem Geflüchteten-Sample diese Frage nicht erhalten haben. Geflüchtet wurde 2018 einfach nicht nach chronischen Krankheiten gefragt.

Viele Grüße,

Andreas