SC3 / SC4: Schulform des Zielkinds

FalkVoit · 1. August 2020 um 07:40

Liebes NEPS-Team,

ich arbeite mit den beiden Kohorten SC3 / SC4. Hier interessiere ich mich für die Schulform welche das Zielkind in der ersten Welle besucht. Hierzu nutze ich die Infos aus der Variable „t723080_g1“ die im Datensatz „CohortProfile“ enthalten ist.

Auffällig ist, dass sehr viele Kinder das Gymnasium oder vergleichbare Schulformen besuchen, die zur Hochschulzugangsberechtigung führen. Nutze ich hier die richtige Variable?

Liebe Grüße,
Falk Voit

dietmar.angerer · 3. August 2020 um 20:37

Hallo Falk!

Die Variable t723080_g1 ist die beste Möglichkeit, die wir bieten können um die Schulform im Panelverlauf abzubilden. Diese Variable gleicht die Angaben von Eltern, Schüler und Klassenkameraden ab, da sich diese Angaben in einigen Fällen unterschieden (z.B. Kind gab an, auf der Realschule zu sein, Elternteil gab an, Kind geht auf Gymnasium).
Die Variable t723080_g1 weicht auch schon in Welle 1 von tx80106 ab. Zweitere hat den „Charm“, dass man weniger komplexe Kategorien hat. Ob im Einzeltfall t723080_g1 oder tx80106, die richtige Wahl für Welle 1 ist, kann man schwer sagen. Im Mittel dürfte aber t723080_g1 die etwas bessere Wahl sein.

Der hohe Anteil der Gymnasiasten scheint plausibel, da die Umfragen freiwillig sind und es dadurch zwangsläufig zu Selbstselektionsprozessen kommt. Ein mäßiger Hauptschüler mit geringem Interesse am Thema Bildung lässt sich eben schwerer für eine solche Studie gewinnen als ein Gymnasiast, der mit dem Gedanken spielt, ein Lehramtstudium zu beginnen.

Ich hoffe, ich konnte etwas weiterhelfen
Viele Grüße
Dietmar

Anne-Wiebke · 6. September 2022 um 10:32

Hallo @dietmar.angerer,

im Rahmen meiner Abschlussarbeit interessiere ich mich auch für die Schulform in SC4, jedoch nicht wie Falk in der Welle 1, sondern in der Oberstufe (Sek. 2). Nutze ich dafür die selbe Variable wie Falk? Ich habe auch gesehen, dass es im Datensatz pTargetCATI die Variable tf11404 gibt, jedoch erhalte ich für diese Variable nur eine geringe Anzahl an Einträgen. Die Variable ts11204 im Datensatz spSchool erscheint mir ansonsten auch noch als eine Möglichkeit, jedoch erhalte ich dort einige Einträge mit der Schulform „Grundschule“. Wie ist das zu erklären?

Viele Grüße,
Anne-Wiebke

dietmar.angerer · 7. September 2022 um 13:46

Hallo Anne-Wiebke!

Ja, ich würde dazu raten, die Variable t723080_g1 aus CohortProfile zu verwenden. Auch wenn diese für die höheren Wellen kaum/gar keine gültigen Werte aufweist. Es ist einfach sehr unwahrscheinlich, dass immer noch irgendjemand aus dieser Kohorte in einer allgemeinen Schule sitzt

Die Daten aus pTargetCATI sind teilweise so spärlich befüllt, weil diese Informationen nur für die aktuelle Schulform befüllt und da immer mehr Zielpersonen im Zeitverlauf die Schule verlassen, gibt es in den höheren Wellen auch nur noch sehr wenige Fälle.

Was die Enträge im spSchool betrifft, kann ich nur spekulieren, wie es dazu kommt, dass sich dort angebliche Grundschüler versammeln. Im Feldinstrument ist Grundschule nicht Teil der Antwortkategorien, aber ob diese Kategorie in der Programmierung fürs CATI tatsächlich ausgeblendet wurde, können wir nicht wissen.
Wenn es eingeblendet wurde, kann ein Spaßvogel dies angegeben haben und der Interviewer hat das einfach so akzeptiert.
Wenn es nicht eingeblendet wurde, ist es auch durchaus möglich, dass ein Interviewer sich vertippt hat und eine 1 statt der richtigen Zahl angegeben hat.

Noch ein Tipp:
Wenn es sich irgendwie umgehen lässt, würde ich in einer Abschlussarbeit aber versuchen auf Episodendaten zu verzichten und und alle sp*-Datensätze meiden - die individuelle Aufbereitung dieser Daten ist nur mit weitreichenden Fähigkeiten im Datenmanagement möglich.

VG
Dietmar

Anne-Wiebke · 14. September 2022 um 10:38

Hallo Dietmar,

vielen Dank für deine ausführliche Antwort.

Wie meintest du das, dass du Episodendaten in Abschlussarbeiten vermeiden würdest?
Da ich in meiner Abschlussarbeit unterschiedliche Einflussfaktoren auf den Studienerfolg untersuchen möchte, würde ich dafür gerne auch die Abschlussnote des Studiums und das Studiumsfach wissen. Bisher wollte ich die Variablen ts15414 & ts15404_g2 aus spVocTrain nehmen. Da du nun geschrieben hast, dass du das nicht empfehlen würdest, welche Variablen würdest du dir stattdessen anschauen?

Viele Grüßen und herzlichen Dank,
Anne-Wiebke

dietmar.angerer · 15. September 2022 um 14:09

Hallo Anne-Wiebke!

Ich rate jedem, der noch keine fortgeschrittenen Fähigkeiten im Umgang mit Episodendaten (z.B. spVocTrain) hat, die Finger bei Abschlussarbeiten davon zu lassen, weil die Verwendung und Aufbereitung dieses Datenformats nicht sehr einfach ist. Das gilt insbesondere, wenn man Variablen der Episodendaten in die verschiedenen pTarget-Daten integrieren will. Das alles kostet sehr viel Zeit und diese Zeit ist bei Abschlussarbeiten ohnehin schon knapp bemessen.

Wenn du lediglich die Schulform aus dem CohortProfile brauchst, kannst du diese einfach an den spVocTrain anspielen. Ich nehme hierbei der Einfachheit wegen die letzte erwähnte Schulform und spiele dann den spVocTrain 1:m via ID_t an CohortProfile. Dann hast du Schulform und die Note des Studiums in einem Datensatz.

use ID_t wave t723080_g1 using "SC4_CohortProfile_D_12-0-0.dta", clear
drop if t723080_g1  == -55
bysort ID_t (wave): keep if _n==_N
isid ID_t
merge 1:m ID_t using "SC4_spVocTrain_D_12-0-0.dta", keep(matched) nogenerate

Ich habe keine Ahnung, was du genau machen willst - wenn du zeitlich variierende Informationen aus pTarget(PAPI/CATI/CAWI) an die richtigen Zeitpunkte der Episodendaten zusammenspielen willst, kann es sein, dass du ein Episodensplitting/Monatssplitting der Episoden machen musst. Das Episodensplitting kann aber eine echte Herausforderung sein…

Wenn du eine reine Ereignisdatenanalyse machst, dann musst du das nicht tun. Zeitlich mehr oder minder invariate Merkmale wie Migrationshintergrund oder Geschlecht, kann man genau wie im Beispiel mit CohortProfile einfach 1:m an spVocTrain anspielen.

Ich hoffe das hilft dir weiter

VG
Dietmar