Regionale Units im NEPS

Hallo zusammen,

Ich habe zwei Fragen, eine spezifische und eine generelle zur Arbeit mit dem SC4.

Spezifische Frage: Ich versuche grade über NEPS Remote mit der Bundesland Variable für SC4 zu arbeiten. Laut NEPS Website sollte diese unter t751001 (Bundesland Wohnort) im Datensatz pTarget verfügbar sein.

Für SC4 gibt es drei Datensätze, die mit pTarget gemeint sein könnte: 1) SC4_pTargetCATI_D_15-0-0, 2) SC4_pTarget_D_15-0-0, 3) SC4_pTargetCAWI_D_15-0-0. Die Variable t751001 ist allerdings ausschließlich im Datensatz 1) SC4_pTargetCATI_D_15-0-0 verfügbar. Wenn eine Befragte nicht am CATI teilgenommen hat, gibt es diese Info dann gar nicht?

Mein Ziel ist, für jede Welle für jede Befragte eine Ortsangabe zu haben (kann Wohnort, Schulort, oder Arbeitsort sein, das ist erstmals nicht so wichtig da wahrscheinlich sehr große Überlappungen bestehen). Gibt es noch weitere Variablen, die ich nutzen könnte, um diese Angabe etwas vollständiger zu generieren? Zunächst bräuchte ich dies nur auf Bundeslandebene, Ziel ist es aber, diese Angabe im Rahmen eines Gastaufenthalten auf Kreisebene zu generieren.

Generelle Frage: Da es kein Datamanual zum SC4 gibt, habt Ihr generell Tips wie ich verstehen kann, welche Personen und Variablen in welchem der Datensets vorhanden sind?

Wenn ich z.B. diese Syntax ausführe:

use „$sc4/SC4_CohortProfile_D_15-0-0“, clear //start with cohort profile

merge 1:1 ID_t wave using „$sc4/SC4_pTarget_D_15-0-0.dta“ //merge with pTarget panel dataset
ren _merge _merge_ptarget

merge 1:1 ID_t wave using „$sc4/SC4_pTargetCATI_D_15-0-0.dta“, keepusing(t751001_g2R t751001_g7 t751001_g4O) // merge with pTarget CATI

ergibt ein tab _merge _merge_ptarget, dass nur etwa 6,000 Datenpunkte (aus 250,000) sowohl _merge == 3 als auch _merge_ptarget == 3 haben. Habe ich also nur 6,000 Datenpunkte, von denen ich sowohl das Bundesland des Wohnorts weiß als auch Survey Befragungsdaten in pTarget? Wieso sind die pTarget Datensätze in SC4 so aufgeteilt, im SC3 aber nicht?

Vielen Dank im Voraus für die Hilfe!

Hi Lara,

wir haben alle Regionalvariablen hier aufgelistet. Im konkreten Fall gibt es noch den Ort der Schule (CohortProfile, tx80109) oder den Wohnort der Eltern (pParent, p751001). Ansonsten auch Orte aus erfassten Schulepisoden (spSchool ts11202, pParentSchool p723030).

Die Datensätze sind nach den jeweiligen Erhebungsmodi aufgeteilt (PAPI,CATI,CAWI). Ein Übersicht darüber, welche Daten von einzelnen Personen verfügbar sind, geben die Indikatorvariablen in CohortProfile (tx805.. “Daten verfügbar: …”).

Hallo Lara!

In der SC4 gibt es für die unterschiedlichen Modi unterschiedliche Datensätze. Der Aufbreiter der SC3 hat sich entschlossen, alle Daten in einem Datensatz zusammenzufassen. Für die SC3 gibt es also nur diesen einen riesigen pTarget-Datensatz. Für beide Kohorten gilt jedoch, dass die Schüler anfangs nur die Papierfragebögen bekamen und daher in der SC4 im pTarget landeten.

Wenn in der SC4 Schüler:Innen NEPS-Schulen oder die allgemeinbildenden Schule verließen, wurde sie per CATI befragt. Erst ab Welle 5 wurde den Noch-Schüler:Innen mit dem Ziel Abitur eine Emulation der Papierfragebögen per CAWI vorgesetzt. Irgendjemand der Verantwortlichen hat dann entschieden, dass diese Papierfragebogennachbildungen auch im pTarget landen sollen und nicht im pTargetCAWI. Gleichzeitig wurden (Teile) dieser Personengruppe auch noch per Telefon befragt. Das kann man sich alles mühsam aus den Methodenberichten zusammenpuzzeln…

Kurzum: Diese Dinge haben Personen damals entschieden und ich frage mich auch oft, warum das so geschehen ist. Diese Entscheidungen sind lange her, die Personen, die für das Studiendesign und die Datenaufbereitung verantwortlich waren, haben mehrfach gewechselt. Warum Dinge dann in der SC3 anders gelaufen sind, lässt sich nur vermuten. Vielleicht haben sie aus den Erfahrungen der SC4 gelernt und daraufhin Designänderungen vorgenommen.

Aber was die Ortsangaben angeht, kann ich mich nur Tobias anschließen: in den Spelldaten findet man letztendlich noch Angaben zu Zielpersonen, die bis im NEPS-Sample verblieben.

Laut der Variablensuche auf der Website, sind die t751001_g*-Variablen nur in pTargetCATI verfügbar.

Ich weiß, dass das Arbeiten mit den NEPS-Daten viel Einarbeitung erfordert, wir versuchen euch aber, so gut es geht, zu unterstützen. Ich hoffe, das hat dir etwas weitergeholfen.

Viel Erfolg und viele Grüße
Dietmar