SC6: Kinder: child ID in spChild(Cohab)

Liebes Team,

ich stolpere darüber, dass im spChild & spChildCohab scheinbar einige Kinder, die aus- und wieder eingezogen sind, mit unterschiedlichen child IDs versehen werden.
Vielleicht irre ich mich, aber könnt ihr das bitte checken?
Ein paar Fälle, die das Problem augenscheinlich machen:
8001918, 8005278, 8005204, 8006040

Lieben Gruß und Dank
Uta

Liebe Uta,

ja, es gibt da ein paar Unschärfen in den Daten. Im aktuellen SUF finden wir insgesamt 508 Befragte, die mindestens 2 Kinder mit unterschiedlicher Kinder-ID und gleichem Geburtsdatum haben. Da manche Befragte auch mehr als 2 Kinder mit gleichem Geburtsdatum aufweisen, finden wir insgesamt 577 Kinder, die das betrifft.
Der größte Anteil der betroffenen Kinder sind sicherlich Zwillinge oder Mehrlinge. Der Anteil von Zwillingen liegt in Deutschland bei ca. 1,25 - 1,5 %. Bezogen auf die insgesamt 28172 Kinder der SC6-Befragten sollten wir also ca. 350 - 420 Zwillinge in unseren Daten erwarten können.
Ein weiterer Teil dieser Dopplung von Kindern entsteht dadurch, dass Befragte in einer Welle dem Aufsatz vorhandener Angaben zu einem Kind widersprechen. In solchen Fällen werden zu diesem Kind in der aktuellen und in späteren Erhebungswellen keine weiteren Angaben erhoben. Datentechnisch bleiben die Daten zu diesem Kind in spChild bis zu der Erhebungswelle erhalten, die vor dem Widerspruch lag. In manchen Fällen gibt jedoch die befragte Person in einer späteren Welle ein Kind mit den selben Geburtsdatumsangaben erneut an. Für diese Neuangabe wird eine neue Kindernummer vergeben. Ob es sich in diesen Fällen um das gleiche Kind handelt, das bereits mit gleichem Geburtsdatum in früheren Wellen erfasst, jedoch aufgrund des Widerspruchs nicht weiter verfolgt wurde, ist schwierig zu entscheiden. In den Daten der SC6 finden sich solche Konstellationen (Widerspruch zu den Angaben eines oder mehrerer Kinder und spätere Neuaufnahmen von Kindern mit identischem Geburtsdatum) bei insgesamt 102 Befragten und 146 Kindern.
Darüber hinaus gibt es sicherlich vereinzelt auch noch Fehler, die im Datenerhebungsprozess gemacht wurden. So sollten für deinen Beispielfall 8001918 in wave = 3 Preloaddaten für die 3 Kinder vorhanden sein, die in wave = 2 noch zum Interviewzeitpunkt mit der befragten Person zusammen wohnten. Offenbar ist bei dem Fall ein Fehler bei der Preload-Übertragung gemacht worden. Deshalb wurden diese 3 Kinder in wave = 3 neu erfasst, statt aufgesetzt.

Viele Grüße, Ralf.

Liebe Uta,

ich habe nun noch einmal versucht, die Zwillinge in den Daten von möglichen Doppelnennungen von Kindern zu trennen. Zwillinge (oder auch Mehrlinge) definiere ich in der Form, dass es um Kinder einer befragten Person geht, die das gleiche Geburtsdatum haben, auch in der gleichen Erhebungswelle erfasst worden sein müssen. Gibt es Kinder einer befragten Person, die das gleiche Geburtsdatum haben, aber in unterschiedlichen Erhebungswellen erfasst werden, definiere ich diese als (aus irgendeinem Grund) doppelt erfasste Kinder.

Ein Stata do-file zur Markierung von Zwillingen und doppelt erfassten Kindern könnte wie folgt aussehen:

use "SC6_spChild_D_10-0-1.dta" , clear
keep if (subspell == 0 & spext == 0) | subspell == 1
drop if ts3320y < 0 | ts3320m < 0
replace ts3320m = ts3320m - 20 if ts3320m > 12
gen gebk = (ts3320y * 12) + ts3320m
sort ID_t gebk child
gen twin = 0
gen doppel = 0
replace twin = 1 if ID_t == ID_t[_n-1] & gebk == gebk[_n-1] & wave == wave[_n-1]
replace twin = 1 if ID_t == ID_t[_n+1] & gebk == gebk[_n+1] & wave == wave[_n+1]
replace doppel = 1 if ID_t == ID_t[_n-1] & gebk == gebk[_n-1] & wave != wave[_n-1]
replace doppel = 1 if ID_t == ID_t[_n+1] & gebk == gebk[_n+1] & wave != wave[_n+1]
keep ID_t child twin doppel
merge 1:m ID_t child using "SC6_spChild_D_10-0-1.dta"

Nach dieser Definition hätten wir in den Daten des SUF SC6 10-0-1 702 Kinder, die als Zwillinge oder Mehrlinge bezeichnet werden könnten (siehe Variable „twin“). Dopplungen von Kindern finden wir 517 (siehe Variable „doppel“), wobei hier jedes genannte Kind einer Dopplung gezählt wird, so dass die Anzahl der Dopplungen nur höchstens die Hälfte der Anzahl der Dopplungskinder beträgt, also in unseren Daten ca. 258. Wären diese Dopplungen ausschließlich Kindern zuzuschreiben, denen die Befragten in einer Welle widersprochen haben, dann müsste es bei den Kindern, die als doppelt markiert sind, 258 Widersprüche geben (variable disagint = 1). Eine Auszählung von „disagint“ bei den Dopplungskindern zeigt, dass wir hier 225 Widersprüche finden. Es bleibt also ein Rest von ca. 33 Dopplungen, die weder Zwillinge sind noch durch Widerspruch verursacht wurde. Um diese Dopplungen aufzuklären, müsste man sich die Einzelfälle anschauen.

Viele Grüße, Ralf.