Stichprobengröße Welle 3 - Unterschiedliche Zahlen in pTarget und Studienüberblick

Liebes NEPS-Team,

wir haben uns die Frage gestellt, wie groß eigentlich die Stichprobe von SC3 pro Welle ist. Dazu gibt es ja Informationen im Studienüberblick. Allerdings haben wir festgestellt, dass die Anzahl der Fälle in pTarget von den Zahlen abweicht (wenn auch nur pro Welle im zweistelligen Bereich). Ein Kollege hat dazu ein R-Skript mit dem Namen 00_Stichprobengroesse_SC3.R erstellt, das ihr in unserem Projektordner (p000231_DUA_3816) in Remote-NEPS findet.

Wie kommen die unterschiedlichen Zahlen zustande?

Grüße aus Berlin!
Jannis

Hi Jannis,

ich habe in euer Skript reingesehen. Ihr prüft ja die Variable tx80220 (Teilnahme-/Ausfallstatus) gegen die Fallzahl in pTarget. Diese Variable gibt nur an, ob eine Person generell an einer Welle teilgenommen hat oder nicht.

Was genau „Teilnahme“ bedeutet, kann unterschiedlich sein. Darum gibt es in den CohortProfile-Datensätzen mehrere Verfügbarkeitsindikatoren: tx8052* (Daten verfügbar: …).
Es kann z.B. sein, dass nur Kompetenzdaten (also Daten in xTargetComptencies) und keine Befragungsdaten in pTarget enthalten sind.

Konkret beziffert die Variable tx80521 (Daten verfügbar: Befragung Zielperson) die Fallzahl in pTarget.
Wenn ihr also zusätzlich auf diese bedingt, sollte der Abgleich funktionieren. Aber Achtung: in der SC3 gibt es aufgrund eines Erhebungsfehlers zwei Fälle doppelt in den pTarget-Daten. Hier müsstet ihr vorher auf die Varible tx20100==1 filtern, um einen 1:1 merge über ID_t/wave zu CohortProfile zu realisieren.

Das erklärt die Unterschiede natürlich, danke schön!