Studentische Erwerbstätigkeit SC5

S_G · 18. Januar 2019 um 14:26

Liebes NEPS-Team,

ich benötige die Angabe, wie viele Stunden die befragte Person neben dem Studium arbeitet und ob es sich dabei um eine Tätigkeit handelt, die mit dem Studium inhaltlich was zu tun hat bezw. diesem förderlich ist. Das Ganze im Spell-Format. Daher habe ich den Datensatz SpEmp verwendet.

Dafür habe ich zunächst alle Spells gelöscht, wo die Tätigkeit vor Beginn des Studiums endet. Nach dem mergen dieser Datei mit dem CAWI Datensatz, komme ich auf unterschiedliche Zeitangaben (z.B. t241014 + t241022 im Vergleich zu ts23223).

Welchen Datensatz würden Sie mir für diese Informationen empfehlen beziehungsweise was mache ich falsch (warum unterscheiden sich die Angaben je nach Datensatz)?

Gleiches Problem habe ich bei der Identifizierung von Personen, die sich im Lehramtsreferendariat befinden. Es gibt mehrere Variablen dazu aus unterschiedlichen Datensätzen.Was ist da am ehesten geeinet oder sollte man lieber alle berücksichtigen?

Edit DS: Tags hinzugefügt

dietmar.angerer · 1. Februar 2019 um 15:41

Hallo SG!

Generell ist es etwas schwierig ohne Blick auf die Syntax zu erkennen, wo es "zwickt"...

Die Ereignissdaten aus spEmp und spVocTrain kannst du im Biography abgleichen, ich denke, dass hast du auch so gemacht.

Was das Zusammenspielen von pTarget*-Datensätzen und sp-Datensätzen angeht, sollte man die Daten nicht mit

use <pTarget_file>
merge 1:m ID_t wave using <sp_file>

zusammenspielen. Das ist in den meisten Fällen eine schlechte Idee, da der wave-Indikator in den Spelldatensätzen lediglich angeben, in welche Welle von diesem Ereignis berichtet wurde. Wenn also eine Zielperson zwei Befragungen ausgesetzt hat und dann wieder erneut befragt wird, werden die Ereignisse der letzten zwei Jahre retrospektiv erhoben und erhalten den wave-Indikator der aktuellen Befragung selbst wenn die Episoden schon längst beendet wurden.

Der wave-Indikator ist in diesen Datensätzen daher etwas unglücklich bzw. irreführend...

Wenn du Panel- und Episodendaten zusammenspielen willst, ist das etwas komplexer. Ein aktuelles Beispiel findest du hier:

Was aber die generelle Übereinstimmung von Angaben in verschiedenen Datensätzen angeht, kann es mitunter größere Abweichungen geben. Das kann mehrere Gründe haben: Einerseits kann es zu Erinnerungsfehlern bei retrospektiv erhobenen Informationen kommen, das dürfte aber eher selten der Fall sein. Aber vielleicht hat er im Online-Survey angegeben Mathe zu studieren aber dabei nicht erwähnt, dass er auf Lehramt studiert. Wenn er im CATI (da werden die Spells erhoben) dann dem Interviewer sagt, er studiere Mathe auf Lehramt, wird das Fach in beiden Modi unterschiedlich verkodet.

Allgemein lässt sich sagen, dass die Informationen in den Spelldatensätzen konsistenter, lückfreier und feingliedriger erhobnen werden als in den anderen Modi, aber leider ist eben viel aufwendiger diese Daten ins Long-Format zu überführen.

Ich hoffe, ich konnte dir etwas helfen.

Viele Grüße.

Dietmar