Fehlen von spezifischen Wellen im Datensatz

Hallo,

ich arbeite zum ersten Mal im Rahmen eines Lehrforschungsprojektes meiner Universität mit dem NEPS-Datensatz. Dabei arbeite ich mit der SC2. Ich arbeite mit den folgenden Variablen: p731802, t31035d, p31035a, tx80501 und zwei von mir erstellten Faktorvariablen bestehend aus jeweils tc00060, tc00100, tc00020 (1) und pc03060, pc03070 (2). Die erste Faktorvariable stellt die abhängige Variable meiner Untersuchung dar. Mein Problem ergibt sich jetzt bei der Regression innerhalb der Längsschnittanalyse. Ich habe kaum einen Wert bei Within. Auch wollte ich zunächst den Längsschnitteffekt der Wellen 6,8,10 betrachten. Jedoch ist mir aufgefallen, dass ich komischerweise in den Wellen 8 und 10 keine Beobachtungen habe, obwohl diese bei den anderen Wellen vorliegen. Nun weiß ich nicht , woran es liegt, dass mir dort die Daten fehlen.

Vielleicht kennt sich jemand mit dieser Problematik aus und könnte mir helfen?

Hallo L_Schroeder,

vor der Analyse von komplexen Daten wie diejenigen, die vom NEPS erzeugt werden, lohnt oftmals ein Blick in das zugehörige Datenmanual (https://www.neps-data.de/Portals/0/NEPS/Datenzentrum/Forschungsdaten/SC2/11-0-0/NEPS_SC2_DataManual_11-0-0_en.pdf). Auch muss man in den allermeisten Fällen noch ein wenig Aufwand in die Datenaufbereitung stecken, bevor man überhaupt eine sinnvolle Analyse damit machen kann.
So hätte eine kritische Analyse der Ausgangsdaten oder auch ein Blick auf Seite 86 vielleicht offenbart, dass es in Wellen 8 und 10 schlichtweg keine Elternbefragung gab. Wenn man also mit Daten aus pParent rechnen möchte, muss man sich für diesen Umstand etwas überlegen. Auch das Geschlecht des Zielkindes (tx80501) liegt nur für Wellen 1-6 vor. Mit plausiblen Annahmen kann man sowohl das Geschlecht als auch den höchsten Bildungsabschluss der Eltern als einigermaßen zeitkonstant ansehen. Insofern macht es hier Sinn, Variablen zu erstellen, die für alle Wellen denselben Wert haben.

Beste Grüße,
Benno Schönberger

Hallo Herr Schönberger,

vielen Dank für diese ausführliche Antwort. Die von Ihnen bereits angemerkten Variablen habe ich bereits als konstant in meiner Datenaufbereitung angenommen. Bezüglich der Elternbefragung war mir nicht bewusst, dass diese ausgerechnet in Welle 8 und 10 nicht stattgefunden hat, danke also für den Verweis auf die entsprechende Seite. Wenn ich nun beispielsweise die Wellen 3,6 und 7 in meiner Längsschnittanalyse verwende, habe ich ein sehr niedriges Within in meiner Regression, welches auch nicht mit der Auswahl anderer Wellen steigt. Kann dies schlichtweg vorkommen in einer entsprechenden Analyse mit den NEPS Daten? Meine Professoren konnten sich diesen niedrigen Wert leider nicht erklären und es wurde kein Fehler in meiner Syntax gefunden. Ist Ihnen dieses Problem vielleicht schon einmal unter gekommen?

Beste Grüße
Luisa S.

Hallo Luisa,

leider kann ich dir bei inhaltlichen Fragen keine Auskunft erteilen, weil ich da schlichtweg ebenso wie deine Professoren nicht weiterhelfen kann. Wir vom FDZ sind prädestiniert, bei Fragen rund um Datenstruktur, Missings, Zusammenführen von Datensätzen und ähnlich gelagerten eher strukturellen Problemen zu helfen.
Aber wenn du Glück hast, fühlt sich vielleicht ein anderer Nutzer berufen und kennt sich mit derartigen Problemen aus…?

Beste Grüße und viel Erfolg,
Benno Schönberger