Hallo zusammen,
für die Erstellung meines Datensatzes habe ich ein 1:m Merge von dem Datensatz SC6_CohortProfile_D_14-0-0.dta und SC6_spEmp_D_14-0-0.dta durchgeführt. Ich möchte für meine Forschungsarbeit untersuchen, ob die Erwerbstätigkeit einen Einfluss auf die Persönlichkeitsentwicklung hat (Big five). Dafür benötige ich für meinen MZP 1 (Welle 5) und MZP 2 (Welle 8) Personen, die höchstens 8 h/W arbeiten oder auch arbeitslos sind. Sie sollten jedoch nicht in einer Ausbildung sein oder Student sein. Für den zweiten MZP (Welle 8) benötige ich zusätzlich für meine Experimentalgruppe Probanden, die nun mindestens 35 h/W arbeiten.
Ich habe meinen Datensatz lediglich über die Variable ts23223_g1 (tatsächliche Wochenarbeitszeit) erstellt. Jedoch habe ich zu wenige Probanden in der Experimentalgruppe über diese Variable erhalten. Es wäre auch möglich über die Variable ts23901 (Hilfsvariable aktuelle Erwerbstätigkeit) Personen in meine Stichprobe mit aufzunehmen, jedoch verstehe ich hier nicht, was unter Erwerbstätigkeit in dem Kontext verstanden wird und ob darunter auch Personen in einer Ausbildung oder Studierende fallen. Könnten Sie mir dazu weitere Infos geben?
Eine weitere Frage ist, ob ich lediglich durch den Datensatz spEmp zu den für mich erforderlichen Daten komme. In der Variable ts23223_g1 werden für die tatsächliche Arbeitszeit auch 0 h/W angegeben. Dadurch wären Probanden die auch gar nicht arbeiten durch diese Variable zu identifizieren, oder? Oder muss ich den spEmp Datensatz mit dem Datensatz spUnemp mergen, um herauszufinden, ob eine Person zu einem bestimmten Zeitpunkt (Welle 5 oder Welle 8) gar nicht, nicht einmal 8 h/W gearbeitet hat?
Eine weitere Frage habe ich für die Big five. Diese werden durch insgesamt fünf Variablen repräsentiert mit der Endung _g1 und durch elf Variablen die alphabetisch gekennzeichnet sind von a- k. Es wäre methodisch sinnvoll nur mit den alphabetisch sortierten zu arbeiten, oder? Ich finde die mit der Endung _g1 würden in der Analyse nicht sonderlich viel Aufschluss geben, da es nur fünf Variablen sind. Wann würde es denn überhaupt einen Sinn machen mit denen, die die Endung _g1 haben, zu arbeiten?
Ich freue mich sehr über eine möglichst schnelle Hilfe oder auch über einen Lösungsvorschlag. Ich setze mich schon seit zwei Wochen mit den Datensätzen auseinander und komme leider nicht wirklich weiter. Ich freue mich ebenfalls auch über genauere Informationen zum Datensatz spEmp, da ich vieles sehr verwirrend finde, wie, dass Personen, die nach Variable ts23901 nicht erwerbstätig sind, trotzdem eine hohe Anzahl an Wochenstunden nach ts23223_g1 haben.
Vielen Dank schonmal.
Viele Grüße
Simge