Hallo SG!
Generell ist es etwas schwierig ohne Blick auf die Syntax zu erkennen, wo es "zwickt"...
Die Ereignissdaten aus spEmp und spVocTrain kannst du im Biography abgleichen, ich denke, dass hast du auch so gemacht.
Was das Zusammenspielen von pTarget*-Datensätzen und sp-Datensätzen angeht, sollte man die Daten nicht mit
use <pTarget_file>
merge 1:m ID_t wave using <sp_file>
zusammenspielen. Das ist in den meisten Fällen eine schlechte Idee, da der wave-Indikator in den Spelldatensätzen lediglich angeben, in welche Welle von diesem Ereignis berichtet wurde. Wenn also eine Zielperson zwei Befragungen ausgesetzt hat und dann wieder erneut befragt wird, werden die Ereignisse der letzten zwei Jahre retrospektiv erhoben und erhalten den wave-Indikator der aktuellen Befragung selbst wenn die Episoden schon längst beendet wurden.
Der wave-Indikator ist in diesen Datensätzen daher etwas unglücklich bzw. irreführend...
Wenn du Panel- und Episodendaten zusammenspielen willst, ist das etwas komplexer. Ein aktuelles Beispiel findest du hier:
Was aber die generelle Übereinstimmung von Angaben in verschiedenen Datensätzen angeht, kann es mitunter größere Abweichungen geben. Das kann mehrere Gründe haben: Einerseits kann es zu Erinnerungsfehlern bei retrospektiv erhobenen Informationen kommen, das dürfte aber eher selten der Fall sein. Aber vielleicht hat er im Online-Survey angegeben Mathe zu studieren aber dabei nicht erwähnt, dass er auf Lehramt studiert. Wenn er im CATI (da werden die Spells erhoben) dann dem Interviewer sagt, er studiere Mathe auf Lehramt, wird das Fach in beiden Modi unterschiedlich verkodet.
Allgemein lässt sich sagen, dass die Informationen in den Spelldatensätzen konsistenter, lückfreier und feingliedriger erhobnen werden als in den anderen Modi, aber leider ist eben viel aufwendiger diese Daten ins Long-Format zu überführen.
Ich hoffe, ich konnte dir etwas helfen.
Viele Grüße.
Dietmar