SC6: Viele Overlaps bei Partner*innen

Liebes Team,

ich habe die Befürchtung, dass im Partnerschafts-File einige Dopplungen drin sind. In mehreren 100 Fällen sind die Geburtsdaten von mehreren Partner*innen und die Informationen zur Kohabitation, erhoben in mehreren Wellen, exakt gleich; in vielen anderen Unterscheiden sie sich nur um einzelne Ziffern, z.B. der Jahreszahl, was auf Erinnungslücken zurück zu führen sein könnte. Wisst ihr dazu etwas oder könnt das nochmal prüfen?

Dank und Gruß
Uta

Liebe Uta,

wir schauen uns das nochmal genauer an, brauchen aber dafür ein bisschen mehr Zeit. Wir melden uns dann hier.

Viele Grüße

Simon

Liebe Uta,

ich gehöre im NEPS zum Team von Etappe 6 und 8. Wir sind unter anderem für die Erhebung der Startkohorte 6 zuständig.

Die Antwort auf deine Frage, ob es Dopplungen von Partnern im Partnerschafts-File spPartner gibt, ist eindeutig: ja, die gibt es. Diese Dopplungen haben unterschiedliche Ursachen, die teilweise damit zusammenhängen, wie Partnerschaften, die im Partnerschaftsmodul längsschnittlich erfasst werden, definiert sind. Im Partnerschaftsmodul werden nur solche Partnerschaften über die Erhebungswellen hinweg erfasst und weiter verfolgt, mit denen die befragte Person zusammen gelebt hat oder verheiratet war. Partnerschaften, mit denen die befragte Person weder zusammen lebte noch verheiratet war (sogenannte LAT-Partnerschaften, LAT = living apart together), werden zwar auch erfasst, jedoch nur querschnittlich, also nur LAT-Partner, mit denen die befragte Person jeweils zum Interviewzeitpunkt zusammen ist/war. LAT-Partnerschaften können aufgrund ihrer querschnittlichen Erhebung per se nicht über die Erhebungswellen hinweg eindeutig verfolgt werden. Bei länger bestehenden LAT-Partnerschaften ist davon auszugehen, dass sie in jeder Erhebungswelle immer wieder neu erfasst werden. Die Dopplung der Erfassung von LAT-Partnerschaften ist also systematisch. Die Daten zu den LAT-Partnerschaften sind nicht im Datensatz spPartner sondern in pTarget abgelegt.

Wie die unterschiedlichen Partnerschaftsformen definiert sind und wie sich die Erfassung von verheirateten bzw. zusammenlebenden Partnerschaften zu LAT-Partnerschaften unterscheiden lässt sich am besten in den Programmiervorlagen zum jeweiligen Erhebungsinstrument nachvollziehen (siehe hierzu beispielsweise die Programmiervorlage der SC6 für Erhebungswelle 8 im Datendokumentationsbereich dieser Startkohorte auf dem neps-data Portal: https://www.neps-data.de/Portals/0/NEPS/Datenzentrum/Forschungsdaten/SC6/Feldversionen/SC6_w8.pdf).

Bei der von uns gewählten Art der Erfassung von Partnerschaften im Partnermodul (Verheiratete und/oder Zusammenlebende) kann es auf drei unterschiedliche Arten zu Dopplungen von Partner kommen (sieht man einmal von zufälligen Fehleingaben ab):

  • Es können Partnerschaften erhoben werden, die in irgendeiner (späteren) Erhebungswelle beendet werden und wiederrum in einer späteren Erhebungswelle erneut erfasst werden, weil die befragte Person erneut eine Partnerschaft mit dieser Person einging. In solchen Fällen ist das Geburtsdatum und oft auch das Kohabitationsdatum ("Wann sind Sie (das erste Mal) zusammengezogen?") der beiden erfassten Partnerschaften identisch. Das Erhebungsinstrument forscht nicht danach, ob bereits früher einmal eine Partnerschaft mit identischen Angaben erfasst worden ist, da auf Basis der erfassten Angaben zu Partnern eine eindeutige "Wiedererkennung" solcher Partner faktisch nicht möglich ist.
  • Es können unverheiratete Partnerschaften erfasst werden, bei denen die Personen anfänglich zusammenleben, danach aus irgendeinem Grund getrennt leben (z.B. weil eine der Personen aus beruflichen Gründen in einem anderen Ort leben muss), um später wieder zusammen zu leben. Sobald unverheiratete Paare auseinander ziehen, gilt diese Partnerschaft als LAT-Partnerschaft und wird nicht im wellenübergreifenden Längsschnitt erfasst, sondern im Querschnittsteil. Die Daten dieser Partner wären nach dem Auszug im Datensatz pTarget zu finden. Sobald sie jedoch wieder zusammen ziehen, wird diese Partnerschaft neu im Längsschnittmodul (spPartner) aufgenommen. Damit ist diese Partnerschaft ebenfalls doppelt im Datensatz enthalten. Auch hierbei ist das Erhebungsinstrument nicht in der Lage, einen Abgleich mit allen früheren Partnerschaften durchzuführen, um eventuelle Dopplungen zu identifizieren.
  • Die Informationen zu Partnerschaften (zusammenlebend oder verheiratet), die bei der letzten Erhebungswelle zum Interviewzeitpunkt andauerten, werden jeweils in die aktuelle Erhebungswelle übertragen. Der befragten Person wird als Einstieg in das Partnerschaftsmodul noch einmal vergegenwärtigt, mit wem sie beim letzten Interview entweder unverheiratet zusammen lebte, oder verheiratet zusammen lebte, oder verheiratet getrennt lebte (z.B. "Nun komme ich zu Ihrer Familie. In unserem letzten Interview im <Interviewdatum> haben wir notiert, das Sie damals mit <Partnername> verheiratet waren und zusammen gelebt haben."). Die befragte Person hat dann die Möglichkeit, dieser Aussage zu widersprechen. Tut sie dies, dann wird diese Partnerschaft so behandelt, wie beendete Partnerschaften und die befragte Person erhält die Gelegenheit, eine neue Partnerschaft anzugeben. Öfter ist es in diesem Zusammenhang der Fall, dass die befragte Person nur einem Teilaspekt der oben angegebenen Aussage widerspricht, etwa dass sie damals nicht mit ihrem verheirateten Partner zusammen, sondern getrennt gelebt hat. Da die Partnerschaft bei einem Widerspruch automatisch als beendet gilt, die Partnerschaft jedoch trotzdem andauern kann, wird die befragte Person in solchen Fällen eine neue Partnerschaft angeben, die identisch ist mit der alten Partnerschaft, jedoch verändert in dem Detail, das sie anders erinnert als im Einstiegstext vorgegeben. Das hört sich etwas umständlich an und ist es leider auch. Zurzeit ist im Erhebungsinstrument kein Verfahren implementiert, das erfasst, welchem Aspekt des Einstiegstextes widersprochen wurde. In diesem Punkt wäre es sicherlich wünschenswert, das Erhebungsinstrument zu optimieren. Auch in diesen Fällen wird die Dopplung der Partnerperson in den Daten zu finden sein.

Diese drei beschriebenen Fälle sind die primären Ursachen für die Dopplung von Partnerpersonen im Datenfile spPartner. Vergleicht man die Geburtsdatumsangaben der Partnerschaften im Datensatz spPartner, so findet man im aktuellen SUF SC6 8-0-0 von den insgesamt 22748 erfassten Partnerschaften 929 Fälle mit jeweils 2 Partnern mit identischem Geburtsdatum. Das sind ca. 4,1 % aller Partnerschaften. Man kann davon ausgehen, dass der größte Teil dieser Partnerschaften Dopplungen des/r gleichen Partner/in sind. Leider lässt sich jedoch nicht mit Sicherheit ermitteln, in welchen Fällen es sich um eine Dopplung handelt und in welchen Fällen die befragte Person wirklich zwei unterschiedliche Partner/innen mit gleichem Geburtsmonat und –jahr hatte.

Es gibt also gute Gründe, unterschiedliche Partner mit identischem Geburtsdatum als identische Personen anzunehmen. Man muss sich jedoch dabei im Klaren sein, dass man dabei auch ein gewisses (unkalkulierbares) Maß an Fehlzuordnung in Kauf nimmt. Außerdem steckt im Datensatz spPartner nur ein Teil der Partnergeschichte. LAT-Partnerschaften sind dort nicht enthalten und lassen sich auch nicht in diesen Längsschnittdatensatz integrieren, da die Erhebungslogik für LAT-Partner querschnittlich und beschränkt ist, auf Partnerschaften zum jeweiligen Interviewzeitpunkt.

Ich hoffe, dass meine Erklärungen nachvollziehbar sind, auch wenn sich daraus keine unmittelbare Lösung für dein Problem ergibt.

Viele Grüße, Ralf.