SC5 spVoc Train Art des angestrebten Lehramts

Hallo liebes NEPS-Team,
ich habe eine Frage zur Variable tg24202_g1 ihm Datensatz spVocTrain der SC5.
Ich würde über diese Variable gerne all diejenigen Studierenden identifizieren, die Gymnasiallehramt studiert haben und dieses dann auch abgeschlossen haben. Zum erfolgreichen Abschluss würde ich die Variable ts15218 heranziehen.
Allerdings gibt es bei der Variable tg24202_g1 oft den Vermerk „Wert aus letztberichteter Teilepisode“. Allerdings ist solch eine „letztberichtete Teilepisode“ oftmals dann gar nicht vorhanden. Hättet ihr also eine Idee, wie ich die Studierenden des Gymnasiallehramts effizient identifizieren kann?
Liebe Grüße
Luise

Hallo Luise!

Wie immer: ich werde dem Problem zeitnah nachgehen.

VG
Dietmar

Hallo Luise!

Also ich habe keine wirklich zufriedenstellende Lösung gefunden. Ich habe mir die Rohdaten angesehen. Das sollte so nicht sein und ich muss wahrscheinlich ein Update der Daten veröffentlichen lassen, damit das Problem gelöst wird.
Ich habe mal versucht, mit Hilfe der Lehramtsvariable (ja/nein) (tg24201) und den offenen Angaben, die Zahl der Fälle mit -29 zu senken. Das gelang mir aber nur unzureichend mit den SUF-Daten. Wie in der Tabelle am Ende zu sehen ist, gibt es Fälle 614 Fälle bei denen aus den offenen Angaben (tg24202_O), keine Werte für tg24202_g1 kodiert werden konnten und laut tg24201 sind 704 Fälle keine Lehramtsstudierende. Aber es bleiben noch immer 1643 fehlerhafte Fälle übrig.
Ich kann aber das Update erst in Angriff nehmen, wenn ich mit der SC4 fertig bin und ich will dazu keine Prognosen abgeben, weil Prognosen immer falsch sind, sorry.

Sorry for the bad news

VG
Dietmar

local path C:/Users/bainb201/Desktop/Data/SC5_D_19-0-0/Stata14
use "`path'/SC5_spVocTrain_D_19-0-0.dta" , clear
drop if tx20100 != 1 | disagint == 2

generate marker = tg24202_g1==-29 & subspell==0 // Variable generieren um Fehler zu markieren
bysort ID_t splink: egen any_marker = max(marker) // alle Teilspells markieren, die den Fehler beinhalten

label define `: value label tg24202_g1' -20"kein Lehramtsstudium", modify
label define `: value label tg24202_g1' -21"offne Angabe nicht kodierbar", modify
label define `: value label tg24202_g1' -92"Frage irrtümlich nicht gestellt", modify

replace tg24202_g1 = -20 if tg24201 == 2 & !inrange(tg24202_g1,1,6)
replace tg24202_g1 = -21 if !inlist(tg24202_O,"-55 (not determinable)","-29 (Value from last-mentioned sub-episode)","") & !inrange(tg24202_g1,1,6) & tg24201 == 1
replace tg24202_g1 = -98 if missing(tg24202_g1) & subspell == 0 & tg24201==-98 
replace tg24202_g1 = -92 if missing(tg24202_g1) & subspell == 0 & tg24201==-92 
replace tg24202_g1 = 6 if inlist(ts15221_g1,12,14,17) & missing(tg24202_g1) & subspell == 0
}

fre tg24202_g1 if subspell == 0 & marker == 1

tg24202_g1 -- Art des angestrebten Lehramtsabschlusses (aggregiert; CATI)
-----------------------------------------------------------------------------------------------
                                                  |      Freq.    Percent      Valid       Cum.
--------------------------------------------------+--------------------------------------------
Valid   -29 Wert aus letztberichteter Teilepisode |       1643      55.49      55.49      55.49
        -21 offne Angabe nicht kodierbar          |        614      20.74      20.74      76.22
        -20 kein Lehramtsstudium                  |        704      23.78      23.78     100.00
        Total                                     |       2961     100.00     100.00           
-----------------------------------------------------------------------------------------------
/*

sdsd