Missings bei SC5

Liebe Neps-Nutzer,
ich arbeite derzeit über den Remote-Zugang mit Daten der ersten Welle der SC 5. Bei der Aufbereitung bin ich auf einige Variablen gestoßen, die sehr viele missings aufweisen.
So gibt es im Datensatz pTarget CATI die Variablen tg10001 (Zulassungsbeschränkung) und tg12003 (Wunschstudium erfüllt). Beide Variablen weisen für 2302 Fälle den missing-Code -20 auf, was laut 
Codebook dafür steht, dass die Frage gar nicht gestellt wurde. Warum wurden so vielen Befragten diese 
beiden Fragen nicht gestellt?

Außerdem habe ich mir aus den Spell-Daten des Datensatzes spVocTrain eine Variable erstellt, die Auskunft darüber gibt, ob die Studierenden 
an einer Universität oder an einer Fachhochschule studieren. Dazu habe ich die Variable tg01003_ha (Art der Hochschule) herangezogen und die Werte für diejenigen übernommen, bei denen die Variable h_aktstu dafür sprach, dass es sich um die aktuelle
Studienepisode handelt. Werden auch hier nur die Befragten der Welle 1 betrachtet, die insgesamt 17910 
Befragte umfasst, weist auch diese Variable 4653 missings auf. Auch hierbei stellt sich mir die Frage, warum diese Variable so viele missings enthält?
Wurden generell einige Angaben, die in den spell-Daten enthalten sind, nicht bei allen abgefragt? 
Danke für die Auskunft.

 


Edit: Tags ergänzt

Hallo Jasmin!

Die Antwort bzgl. der Frage zu den Variablen im pTagetCATI bekommst du schon mal: Die Items stammen aus dem Rekrutierungsfragebogen (PAPI) und eingie der Fragen wurden dann bei Personen, die im PAPI nicht teilnahmen, später im CATI nicht nacherhoben. Warum genau so entschieden wurde, kann ich, wenn du willst, beim DZHW nachfragen.

Viele Grüße.

Dietmar

Hallo Jasmin!

Ich habe mir nun den spVocTrain angesehen:

Wenn ich dich richtig verstehe, behälst du alle Fälle für die gilt:  h_aktstu==1, richtig?

Wenn ich mit Stata

use "K:\work\NEPS\Daten\SC5_9-0-0\SC5_spVocTrain_D_9-0-0.dta", clear
keep if h_aktstu==1
tab tg01003_ha, mis

eingebe, erhalte ich lediglich vier Verweigerer (-97) und drei Personen, die im Ausland studieren oder garnicht (-21)

Bitte beachte, dass  h_aktstu lediglich  Ausbildungsepisoden erfasst, die zum WS 2010 begonnnen haben, Studienwechsel- und Studienwiederaufnahmen, werden so nicht erfasst.

 

Viele Grüße.

Dietmar
 

Hallo Dietmar,

vielen Dank für die beiden Antworten.

Die Erklärung bezüglich des pTargetCATI leuchtet mir ein. Jedoch habe ich immer noch den Eindruck, dass die spell-Daten zum Teil nicht vollständig sind, also nicht für alle Befragten erhoben wurden. Hier ein Beispiel:

Öffnet man den Datensatz spEmp_R_9-0-0.dta, lässt sich die IDs durchzählen mit

by ID_t: gen n1=_n und lässt sich das Erbenis mit fre n1 ausgeben, wird für 15722 Fälle der Wert 1 ausgegeben. Also sind die spell-Daten nur für 15722 Fälle verfügbar, oder? In Welle 1 wurden jedoch 17910 Personen befragt. Gibt es also einen Grund, warum für knapp 2000 Personen keine Daten verfügbar sind? Heißt das, dass die Personen schlichtweg nie vor oder während des Studiums berufstätig waren?

Viele Grüße, Jasmin

Hallo Jasmin!

Dass es nur von 15722 Personen Erwerbsepisoden gibt, bedeutet, dass nur 15722 von 17910 Personen über den Verlauf ihres Erwerbslebens berichten. Aber ich würde es als plausibel erachten, dass rund 2000 Personen noch nie gearbeitet haben und/oder von solchen Arbeiten nicht berichten wollen.

 

Viele Grüße.

Dietmar.