SC3 - Mehrsprachigkeit

Liebes NEPS-Team,

ich untersuche W1 in SC3. Unter anderem möchte ich die Probanden in Gruppen nach Sprachbiographie einteilen. In einem ersten Schritt, habe ich versucht, nur zwei Gruppen zu bilden, eine einsprachige und eine mehrsprachige. Allerdings gibt es sehr viele verschiedene Variablen, die Aussagen über die Sprache der Probanden machen und diese scheinen sich teilweise zu widersprechen.

Mein erster Versuch war die Variable t410010_g1. Wenn sie >= 1 ist, müsste es ja mindestens eine weitere Sprache neben Deutsch im Verlauf der Kindheit gegeben haben. Dies scheint allerdings nicht verlässlich, da einige hier Deutsch angegebne haben, obwohl dies ihre einzige Sprache ist und andere Deutsch nicht angegeben haben, da sie dies erst mit 6 Jahren oder später lernten.
Wie kommt die Anzahl der Nennungen in t410010_g1 zustande? Aus der Dokumentation des Fragebogens entnehme ich, dass sie aus Frage 52 entsteht, allerdings wird in der Frage explizit verlangt, nur eine Sprache zu nennen.

Nun versuche ich, die Probanden stattdessen in drei Gruppen einzuteilen:

  • simultan bilingual (mind. 2 Sprachen erlernt bis zum Alter von 3 Jahren)
  • sukzessiv bilingual (mind. 2 Sprachen erlernt im Alter von 3 bis 12 Jahren)
  • monolingual (nur eine Sprache erlernt bis zum Alter von 12 Jahren)
    Für die simultane Gruppe stehen nun zwei Möglichkeiten zur Verfügung:
    Die Variablen p410000_R und p410002_R zusammen geben aus Sicht der Eltern Aufschluss über Sprachen bis zum Alter von 3 Jahren. Im Falle einer simultanen Bilingualität mit Deutsch+eine andere Sprache könnten ebenfalls die Variablen t41000a_g1 und t410020 in Kombination Auskunft geben. Nun habe ich auf beide Arten Gruppen eingeteilt. Diese Gruppen haben allerdings eine sehr geringe Überschneidung, d.h. weniger als 10 % der Fälle wurden auf beide Arten derselben Gruppe (simultan vs. nicht-simultan) zugeordnet. Version 1 auf Grundlage des Elternfragebogens berücksichtigt natürlich nicht nur Deutsch+eine andere Sprache als Kombinationen, aber selbst, wenn ich nur diejenigen Fälle auswähle, die Deutsch angegeben haben als eine dieser Sprachen, ist die Übereinstimmung der beiden Methoden sehr gering.
    Auch mein Versuch, monolinguale Kinder einzuteilen, war ähnlich. Hier ist bereits eine große Diskrepanz in der Gurppenzuordnung entstanden, wenn die beiden target Variablen t41000a_g1 und t410010_g1 als Vergleich verwendet wurden. Auch eine Nicht-Nennung in p410002_R hat zu kaum Übereinstimmungen mit den anderen beiden Gruppenzuordnungen (t41000a_g1 und t410010_g1) geführt.

Daher nun meine Frage, ob ihr einen Tipp habt, welche Variablen ich zugrunde legen kann, um die oben beschriebene dreistufige Gruppenbildung zur Mehrpsrachigkeit zu erreichen oder erst einmal eine zweistufige.
Vielen Dank im Voraus für die Hilfe!

Viele Grüße
Alina

Hallo Alina,

die Kodierung der Sprach-Variablen in den NEPS-Datensätzen ist nicht immer auf den ersten Blick zu erfassen. Dort, wo wir in einem nicht technisch gestützten Instrument (also in aller Regel: im PAPI) Sprachen erfragen, können wir nicht im Feld sicherstellen, dass die Befragten sich daran halten, nur eine Sprache pro Variable (bspw.: Erstsprache) anzugeben.
Weil wir das nicht können, müssen wir dort Mehrfachantworten abbilden; sie resultieren in aller Regel daraus, dass Personen eine Sprache angekreuzt, und im „sonstiges: ____“-Feld eine weitere/andere angegeben haben – manchmal sogar mehrere.

Im Ergebnis kodieren wir die Anzahl der gemachten Angaben in der Variable mit dem Suffix _g1, und die Inhalte der angegeben Sprache in Variablen mit dem dann fortlaufenden Suffix g2 bis g5.

Die beiden skizzierten Herangehensweisen (Kind-Angaben aus Klasse 5 vs. Elternangaben) können zum Ziel führen. Es ist aber (und das kannst du jetzt auch bestätigen) nicht davon auszugehen, dass sie identische Angaben enthalten; zweierlei ist zu bedenken:

  1. Die befragten Kinder sind in der 5. Klasse. Ob sie valide Aussagen dazu treffen können, wann exakt sie begonnen haben, die deutsche Sprache zu erlernen, ist vermutlich Erinnerungseffekten unterworfen.
  2. Nicht alle Eltern haben sich zur Teilnahme an NEPS-Elternbefragungen bereit erklärt. Nur rund zwei Drittel der Eltern aus SC5 konnten wir in einem Elterninterview in Welle 1 befragen.

Welche der beiden Operationalisierungsmöglichkeiten nun ratsam ist, hängt auch deutlich von dem größeren Erkenntnisinteresse, bzw. dem Zuschnitt eines Analysedatensatzes, ab. Wenn ohnehin Elterninformationen verwendet werden sollen, also der Ausfall von einem Drittel der Stichprobe auch wegen anderen Kovariaten notwendig ist, kann es sinnvoll sein, die mutmaßlich validere Information aus den Elterndaten zu verwenden. Ist allerdings dies der einzige Grund, wegen dem auf ein Drittel der Befragten „verzichtet“ werden müsste, so sollte vermutlich die Kind-Information genutzt werden.

Bei dieser Entscheidung gibt es aber kein pauschales „richtig“ oder „falsch“. Beide Herangehensweisen lassen sich inhaltlich bzw. theoretisch begründen.

Ich hoffe, das hilft etwas weiter. Beste Grüße
Bela

Hallo Bela,

vielen Dank für die ausführliche Antwort! Das hilft mir auf jeden Fall weiter. Da ich, wie du richtig vermutest, eh auf einige Informationen aus den Elternfragebögen angewiesen bin, werde ich mich auch bei dieser Frage danach richten. Das Alter der Kinder war ein guter Einwand.

Vielen Dank und viele Grüße
Alina