Variablen zur Datumsangabe - Survey Month 1 vs. Survey Month 2

Hallo,

für mein Forschungsprojekt ist es wichtig zu wissen, wann eine Frage oder ein Test beantwortet wurde. In einigen Kohorten gibt es jedoch zwei Datumsvariablen, die z. B. „Survey Month 1“ und „Survey Month 2“ genannt werden (tx8610m und tx8611m in SC2 CohortProfile). Kann ich irgendwie herausfinden, welche Frage bzw. welche Testung an welchem dieser Daten erhoben wurde? Innerhalb von Wellen und Befragten weichen die beiden Daten leider häufig voneinander ab.

Vielen Dank und viele Grüße
Lucas

Lieber Lucas,
vielen Dank für deinen Beitrag. Es tut uns Leid, aber leider verzögert sich die Antwort noch etwas.
Vielen Dank für dein Verständnis und viele Grüße
Martina

Hallo Lucas!

Ich versuche deine Fragen zu beantworten. bei tx8610m und tx8611m handelt es sich um die Daten Testungstage. In Welle 6 gab es zwei Testtage. An Tag 1 wurden die Domänen Mathe und Lesen erhoben. Und an Testtag 2 wurde Orthographie erhoben. Mehr dazu findest du im Methodenbericht der Welle 6 z.B. auf S.14
https://www.neps-data.de/Portals/0/NEPS/Datenzentrum/Forschungsdaten/SC2/6-0-0/NEPS_SC2_FieldReport_w6_TP_group_de.pdf

Die Items des Testtages 1 sind demnach mag5d041_sc2g4_c mag4q101_c mag4r021_c mag5v271_sc2g4_c mag4q011_c mag4r071_c mag4d131_c mag5q231_sc2g4_c mag5q301_sc2g4_c mag4v121_c mag5d051_sc2g4_c mag4q060_c mag4d031_c mag5q140_sc2g4_c mag4v111_c mag4r041_c mag4r042_c mag4q051_c mag4q091_c mag4q092_c mag4d14s_c mag5v071_sc2g4_c mag5r191_sc2g4_c mag4d081_c mag4_sc1 mag4_sc2 mag4_sc1u mag4_sc2u reg50110_sc2g4_c reg5012s_sc2g4_c reg50130_sc2g4_c reg50140_sc2g4_c reg50150_sc2g4_c reg5016s_sc2g4_c reg50170_sc2g4_c reg50210_sc2g4_c reg50220_sc2g4_c reg50230_sc2g4_c reg50240_sc2g4_c reg50250_sc2g4_c reg5026s_sc2g4_c reg50310_sc2g4_c reg50320_sc2g4_c reg50330_sc2g4_c reg50340_sc2g4_c reg50350_sc2g4_c reg50360_sc2g4_c reg50370_sc2g4_c reg50410_sc2g4_c reg5042s_sc2g4_c reg50430_sc2g4_c reg50440_sc2g4_c reg5045s_sc2g4_c reg50460_sc2g4_c reg50510_sc2g4_c reg5052s_sc2g4_c reg50530_sc2g4_c reg50540_sc2g4_c reg5055s_sc2g4_c reg50560_sc2g4_c reg50570_sc2g4_c reg4_sc1u reg4_sc2u reg4_sc1 reg4_sc2.
Die Items des Testtages 2 org41001_c org41002_c org41003_c org41004_c org41005_c org41006_c org41007_c org41008_c org41009_c org41010_c org41011_c org41012_c org41013_c org41014_c org41015_c org41016_c org41017_c org41018_c org41019_c org41020_c org41021_c org41022_c org41023_c org41024_c org41025_c org41026_c org41027_c org41028_c org41029_c org41030_c org41031_c org41032_c org41033_c org41034_c org41035_c org41036_c org41037_c org4_sc1a org4_sc2a org42001_c org42002_c org42003_c org42004_c org42005_c org42006_c org42007_c org42008_c org42009_c org42010_c org42011_c org42012_c org42013_c org42014_c org42015_c org42016_c org42017_c org42018_c org42019_c org42020_c org42021_c org42022_c org42023_c org42024_c org42025_c org42026_c org42027_c org42028_c org42029_c org42030_c org42031_c org42032_c org42033_c org42034_c org42035_c org42036_c org42037_c org42038_c org42039_c org42040_c org42041_c org42042_c org42043_c org42044_c org42045_c org42046_c org42047_c org42048_c org42049_c org42050_c org42051_c org42052_c org42053_c org42054_c org42055_c org42056_c org42057_c org42058_c org42059_c org42060_c org42061_c org42062_c org42063_c org42064_c org42065_c org42066_c org42067_c org42068_c org42069_c org42070_c org42071_c org42072_c org42073_c org42074_c org42075_c org42076_c org42077_c org42078_c org42079_c org42080_c org42081_c org42082_c org42083_c org42084_c org42085_c org42086_c org42087_c org42088_c org42089_c org42090_c org42091_c org42092_c org42093_c org42094_c org42095_c org42096_c org42097_c org42098_c org42099_c org42100_c org42101_c org42102_c org42103_c org42104_c org42105_c org42106_c org42107_c org42108_c org42109_c org42110_c org42111_c org42112_c org42113_c org42114_c org42115_c org42116_c org42117_c org42118_c org42119_c org42120_c org42121_c org42122_c org42123_c org42124_c org42125_c org42126_c org42127_c org42128_c org42129_c org42130_c org4_sc1b org4_sc2b.

Wenn du Stata benutzt, kannst du comp2long aus unserem Paket nepstools benutzen um die Kompetenzdaten ins long-format zu überführen. Dann sieht man, in welcher Welle welche Items gelaufen sind.

Wenn du die Daten aber im wide-format belassen willst, kann du dir die wave_w*-Dummies genauer ansehen. In Welle 6 (wave_w6) steht z.B. in 2445 Zeilen, dass keine Daten von Welle 6 enthalten sind. Wenn du nun z.B. die Items mag4q060_c oder reg50150_sc2g4_c betrachtest, findest du ebenfalls 2445 Personen, die nicht teilgenommen haben (-56). Wenn also in bestimmten wave-dummies die Häufigkeit des Wertes 0 mit der Häufigkeit in Items mit dem Wert -56 übereinstimmen, weißt du in welcher Welle ein Item gelaufen ist, ohne in die Doku zu sehen. Ja, das ist etwas gaga…

Welche Items an Tag 1 oder 2 gelaufen sind, kann man aber nur erfahren, wenn man die Methodenberichte durchließt.

Ich impliziere, dass du auch noch wissen willst, was es mit dem Befragungstag 2 auf sich hat. Nun da kann ich momentan nicht viel sagen und ich muss noch warten, bis mein Kollege wieder arbeitsfähig ist.

Ich hoffe, ich konnte dir damit etwas weiterhelfen.

LG
Dietmar

Hallo Dietmar,

das hilft mir schon einmal weiter - dann werde ich für die Testtage jeweils in den Methodenberichten nachschauen. Gute Besserung an den Kollegen!

Viele Grüße
Lucas

Hallo noch einmal. Ich bin nun dabei, die Methodenberichte durchzugehen, um die Tests den Testtagen zuzuordnen. Jetzt ist es manchmal (z. B. SC2, Welle 3) so, dass die Häfte der Schüler:innen den einen Test an Tag 1 und die andere Hälfte denselben Test an Tag 2 absolviert haben. Kann ich herausfinden, welche Schüler:innen zu welcher dieser Testgruppen gehören? Meine Vermutung war, dass diese Information in der Variable „ID_tg“ steckt. Wenn ich diese tabelliere, scheint sie aus der „ID_i“-Variable und Endungen „01“, „02“, „03“ etc. zusammengesetzt zu sein. Allerdings gibt es öfters drei Testgruppen an einer Schule, manchmal auch nur eine. Kannst du mir da weiterhelfen? Das Testdatum ist leider zentral für mein Projekt.

LG Lucas

Hallo Lucas!

Wenn du xTargetCompetencies ins long-format bringst (z.B. in Stata mit comp2long aus unseren NEPStools), kannst du diesen Datensatz mit CohortProfile mergen und dann mit ID_tg und tx80211 etwas besser herausfinden, wann welche Testungen stattfanden.
In den Wertelabels von tx80211 steht oft, welchen Personen(gruppen) welche Tests an welchen Testtagen vorgelegt wurden.

Ich hoffe, das hilft dir etwas weiter.

LG
Dietmar

net install nepstools, from(http://nocrypt.neps-data.de/stata)
comp2long "C:/SC2_xTargetCompetencies_D_10-0-0.dta", clear 

merge 1:1 ID_t wave using "C:/SC2_CohortProfile_D_10-0-0.dta", keep(matched) assert(using matched)

Hallo Lucas,

nun klinke ich mich hier auch mal ein. Ich bin der oben angesprochene erkrankte Kollege, der nun langsam wieder ein bisschen mitarbeiten darf und ich bin der Verantwortliche für die ScientificUseFiles der Startkohorte 2.
Um die Schüler den Testgruppen zuzuordnen, kannst du natürlich die Variablen ID_tg benutzen. Du hast schon vollkommen richtig erkannt, das da die Institutionen-ID drinsteckt. Ansonsten werden nur die von der Schule definierten Testgruppen durchnummeriert. Es steckt also kein tieferer Sinn darin. Aber alle Kinder einer Testgruppe erhalten dieselbe ID_tg. Die Tatsache, dass es manchmal nur eine und manchmal mehrere Testgruppen gibt, lag schlichtweg an der Anzahl der Teilnehmer und den Raumgrößen. Wie die Kinder den verschiedenen Gruppen zugeordnet wurden, kann ich dir leider nicht sagen.
Innerhalb des Datensatzes xTargetCompetencies findest du auch die Variablen tx80211_w[1-11]. In manchen Wellen wurde die Reihenfolge der Testhefte zwischen verschiedenen Testgruppen variiert, um da irgendwelche Reihenfolgeneffekte berechnen zu können. Die verschiedenen Reihenfolgen kannst du dir beispielsweise in tx80211_w3 (für Welle3) anschauen, vielleicht hilft dir das ja auch weiter?

Falls du irgendwelche Hilfestellungen beim Zusammenfügen der verschiedenen Datensätze brauchst, lass es mich wissen!

Alles Gute und viel Erfolg,
Benno

Vielen Dank euch beiden! Das war sehr hilfreich. Mit dem long-format und der tx80211 Variable kann ich herausfinden und kodieren, welcher Test an welchem Tag durchgeführt wurde.

Hallo,

ich würde dieses Thread gerne noch einmal reaktivieren, um nach den Variablen tx8601m und tx8602m zu fragen. Hier geht es ja um das Datum der Befragung der Zielpersonen. Habt ihr hierbei Informationen, welche Teile der Fragebögen an welchen Tagen abgefragt wurden?

Vielen Dank und viele Grüße

Lucas

Hallo Lucas,

dass sowohl tx8601my UND tx8602my befüllt sind, kommt ja nur in Welle 6 vor. Und hier gibt es tatsächlich eine kleine Ungenauigkeit in den Daten, die wir in einem nächsten Update mal bereinigen sollten. In W6 wurden an insgesamt 2 Testtagen sowohl die Kompetenztestung als auch die Schülerbefragung durchgeführt. Dabei wurden für den Fall, dass ein Schülerfragebogen an diesen Testagen ausgefüllt wurde, die Datumsinformation von tx8610[my] und tx8611[my] in tx8601[my] und tx8602[my] kopiert. Die Schülerbefragung fand jedoch tatsächlich immer nur an Testtag2 statt. Du kannst für Welle 6 daher die Informationen aus tx8601[my] getrost ignorieren.

Hilft dir das weiter?

Vielen Dank, das hilft mir sehr weiter! Für die anderen Startkohorten ist jemand anderes zuständig, oder? In SC3 ist das beispielweise in Welle 1 und allen Wellen ab 7 so, dass beide Variablen befüllt sind…

Hallo Lucas,

wie es der Zufall so will, kann ich dir in aller Regel auch mit Fragen zur SC3 weiterhelfen:

In den ersten 4 Wellen der SC3 gab es zusätzlich zu den Befragungen an den Regelschulen parallel auch Kompetenztestungen an Förderschulen. Alle Informationen, wann die entsprechende Schülerbefragung stattgefunden hat, finden sich in tx8601[my]. Mit einer Ausnahme: In den Förderschulen der Welle1 gab es ein verrücktes Rotationsdesign, sodass verschiedene Kompetenztesthefte und aber auch verschiedene Fragebogenversionen an unterschiedlichen Testagen zum Einsatz kamen, daher ist hier ausnahmsweise auch tx8602[my] befüllt, nämlich für diejenigen, die erst an Testtag 2 den Schülerfragebogen ausgefüllt haben.

Und ab Welle 7 gab es zusätzlich zu den regulären Befragungen für den Großteil der Schüler jeweis auch die Einladung zu einer nachgelagerten OnlineBefragung. Die Datumsangaben der regulären CATIS finden sich daher in tx8601[my], die Datumsangaben, wann die OnlineBefragungen abgeschlossen wurden dagegen in tx8602[my].

Weitere Fragen?

Vielen Dank!

Ich war kurz davor, dieselbe Frage für SC4 zu stellen, aber das hat sich von selbst erkärt. Für eventuell in Zukunft Mitlesende: tx8600[my] ist für die reguläre Befragung, tx8602[my] für die CAWI-Befragung - zumindest entnehme ich das den Variablen-Labels.

Damit dürften (hoffentlich) erstmal alle Fragen zu den Datumvariable geklärt sein :slight_smile:

das bleibt abzuwarten :wink:

Es ist tatsächlich noch eine Frage aufgekommen, bei der ich lieber sicher gehen möchte, bevor ich falsche Annahmen über die Daten treffe:

In SC4 sieht es so aus, dass die Variable tx8600[my] nicht gefüllt wurde, wenn die Befragung an einer NEPS-Schule stattfand. Liege ich richtig in der Annahme, dass die Befragung in diesen Fällen am selben Tag wie die Testung (tx8610[my]) stattfand?

Hallo Lucas!

Ja, irgendwie wurde nie ein Interviewdatum für die PAPI-Fragebögen bereitgestellt, für die PAPI-Testungen aber schon. :grimacing:
Meistens sind Testung und Befragung im Schulkontext zeitlich sehr nah aneinander geknüpft. Wenn du mehr dazu wissen willst, muss du die Methodenberichte genauer ansehen. In den Nutzerschulungen ersetze ich aber auch immer das Befragungsdatum durch das Testdatum wenn ersteres fehlt.

LG
Dietmar