Hallos liebes NEPS-Team,
ich arbeite gerade mit dem SUF SC6 12-1-0; genauer bereite ich gerade den spCourses-Datensatz auf.
Dabei bin auf Diskrepanzen zwischen den bereits generierten Angaben zur Gesamtdauer der Lehrgänge und Kurse (t271001) und den Einzelangaben zur Dauer in den jeweils 5 möglichen Kursen gestoßen (t271011_w*).
Der Code, den ich genutzt habe, ist der folgende:
use ${datapath}spCourses${version}.dta, clear
drop if t27800b>=1962 & t27800b<2009 //alle WB vor 2009 raus
*Gesamtlänge der WB (summiert aus den 5 möglichen WB)
mvdecode t271011_w1 t271011_w2 t271011_w3 t271011_w4 t271011_w5, mv(-54,-97,-98)egen dur = rowtotal(t271011_w*) //Dauer der einzelnen 5 möglichen WB aufsummieren
gen diff = dur-t271001 //Differenz zwischen Original- und zuvor erstellter Variable generierensort diff
br ID_t wave t271011_w1 t271011_w2 t271011_w3 t271011_w4 t271011_w5 dur diff t271001
Beim Vergleich der händisch aufsummierten Dauer der 5 möglichen Weiterbildungen und der bereits generierten Dauer (t271001) zeigen sich bei einigen Fällen teils große Unterschiede in den Angaben zur Dauer der Kurse. Habt ihr dazu vielleicht eine Erklärung parat? Oder gibt es eine Empfehlung, welche Angaben „verlässlicher“ sind?
Erneut vielen Dank für Eure Hilfe und viele Grüße
Marco