Liebes NEPS-Forum,
ich möchte, stark zusammengefasst, unterschiedliche individuelle Merkmale am Beginn der Berufsausbildung in unterschiedlichen Berufsfeldern untersuchen (Basiskompetenzen, motivationale und personale Merkmale). Konkreter geht es dabei um Jugendliche, die mit max. MSA die Schule verlassen haben. Den Schulabgang und Schulabschluss bei Verlassen der Schule habe ich bereits identifiziert.
Für die Identifikation des Ausbildungsbeginns fehlt mir noch ein strukturiertes Vorgehen, auch was die Priorisierung mehrerer berichteter Ausbildungsepisoden angeht. Für den ersten Aufschlag würde ich erstmal die längste Episode behalten wollen.
Meine Überlegung war, zunächst einen spellplit durchzuführen, um alle Biography-Episoden überschneidungsfrei zu bekommen. Das hat nach der Vorlage des Survey Paper von Kai Rompczyk and Corinna Kleinert auch gut funktioniert. Ich bin nun unsicher, wie ich mit dem gesplitteten Datensatz und weiter verfahre. Ich würde damit gern den spell identifizieren, der die relevante Ausbildungsepisode markiert (und über deren splink ich dann die weiteren Informationen mergen kann), aber auch die Information behalten, ob vorher eine Ausbildungs- oder ggf. BV-Episode berichtet wurde.
Im Prinzip stelle ich mir den späteren Analysedatensatz mit folgenden Informationen vor:
- Informationen zum Schulabgang (Abgangsdatum, Schulabschluss)
- Querschnittsinformationen zu Personenmerkmalen
- Informationen zum Ausbildungsbeginn (v.a. Ausbildungsberuf)
- ggf. Informationen zu Episoden zw. Schulabgang und Ausbildungsbeginn
Leider kann ich gerade keine konkreten Fragen formulieren, bin aber über jede Anregung zu einem sinnvollen Vorgehen bei der Aufbereitung dieses Datensatzes dankbar. Falls es hier schon ähnliche Threads gibt, die ich übersehen habe, würde mir auch ein Hinweis darauf helfen.
Vielen Dank im Voraus und viele Grüße
Jennifer