SC2 Einfluss von Druck durch high-stakes incentives auf die Zufriedenheit von SchülerInnen in der Grundschule

Guten Tag zusammen,

ich untersuche bundeslandabhängige Unterschiede in der Grundschulempfehlung (bindende oder nicht bindende Lehrerempfehlung vs. freie Entscheidung der weiterführenden Schulform durch Eltern) auf das Wohlbefinden von GrundschülerInnen.

Dafür möchte ich gerne einen Ansatz mit einer lagged Variable nutzen: Durch within-Schüler-Variablen sollen die Ergebnisse zwischen der zweiten klasse und der vierten Klasse in den Bundesländern mit und ohne freier Wahl der Schulform verglichen werden. Dafür verwende ich die Daten aus der SC 2 für SchülerInnen, die im Jahr 2016 zur weiterführenden Schule gewechselt sind. Es sollen also Unterschiede beleuchtet werden zwischen der Zufriedenheit von SchülerInnen der 4. Klasse zwischen Bundesländern mit bindender Lehrerempfehlung (Bayern, Sachsen, Thüringen) und allen Bundesländern mit freier Wahl im Jahr 2016, wo die Lehrerempfehlung über dem Willen der Eltern steht.
Dafür werde ich die Datensätze CohortProfile, pInstitution, pCourseClass, pEducator, pGroups, pTarget und pParent verbinden, um die Analyse durchzuführen.

Nun meine Frage: Wie kann ich eine Dummy-Variable erstellen, die den Wert 1 annimmt, wenn das Bundesland die freie Wahl der Schulform enthält und den Wert 0, wenn es eine bindende Lehrerempfehlung gibt? Gibt es dafür in der SC2 vielleicht schon eine bestimmte Variable oder ist es empfehlenswert, die Variable tx80109_g1 bzw. tx80109_g2R zu codieren zu einer binären Variable (z.B. 0, wenn Bayern, Sachsen, Thüringen)?

Und kann meine Vorgehensweise, die o.g. Datensätze alle miteinander zu verbinden, für die Analyse als sinnvoll erachtet werden? Ich werde keine Daten der Ereignisdatensätze mit einbeziehen. Gibt es trotzdem spezielle Besonderheiten, die ich bei der Datenaufbereitung beachten sollte? Macht es Sinn zuerst CohortProfile m:1 mit pCourseClass zu verbinden, den entstandenen Datensatz dann 1:1 mit pEducator, diesen komplett dann wieder m:1 mit pInstitution, diesen 1:1 mit pParent, 1:1 mit pTarget usw.? Also wäre es die korrekte Vorgehensweise, einer nach dem anderen mit dem jeweils entstanden Datensatz zu verbinden?

Ich wünsche allen einen guten Rutsch ins neue Jahr :slight_smile:
Viele Grüße

Hi Sarah!

Noch eine etwas verspätete Rückmeldung, entschuldige bitte:

Wir haben keine entsprechende Variable zur Schulempfehlung in unseren Daten. Wie du schon vermutest, solltest du diese selbst anhand der Bundeslandvariable(n) bilden können. Diese sind in den Schulkohorten nur im Remote-SUF enthalten, die daraus abgeleitete Variable kann dementsprechend auch nur innerhalb der Remote-Umgebung analysiert werden.

Welche Datensätze du sonst noch benötigst hängt natürlich davon ab, welche Variablen noch analyisiert werden sollen. Allein für die Generierung eines Bundesland-Dummies reicht wahrscheinlich CohortProfile (tx80109_g2R = Bundesland der Schule zum Zeitpunkt der Stichprobenziehung) oder pParent (p751001_g2R Bundesland des Wohnorts der Eltern).

Zum Merging: Sinnvoll ist es, mit CohortProfile zu starten, und an diesen dann einzelne Variablen anzuspielen (ohne die Struktur von CohortProfile, also gegliedert nach ID und Welle, zu zerstören).

  • pParent kann mit einem „merge 1:1 ID_t wave …“ verknüpft werden.
  • pInstitution kann ebenfalls einfach via „merge m:1 ID_i wave …“ angespielt werden.
  • in pTarget und pCourseClass gibt es leider in der SC2 Duplikate von einzelnen Fällen, d.h. hier funktioniert ein 1:1-Merge mit ID_t und wave erst, wenn der Datensatz von Dopplungen bereinigt wurde. Dabei helfen kann die Variable ex20100==1 (mehr dazu siehe in den Releasenotes)
  • in pEducator gibt es diese Dopplungen auch. Zusätzlich kann der Datensatz nur an die Klasse (also z.B. pCourseClass) angespielt werden, nicht direkt an CohortProfile, da nur dort die Linkage-Variable „ID_e“ enthalten ist.