(SC4) Merges mit Biography: Identifier-Problem

Liebes NEPS-Team,

durch den Merge von spGap an Biography sind aus mir unbekannten Gründen Fälle in Biography hinzugefügt worden, die ich nicht identifizieren kann.

Ausangslage Bio: 90.153 Fälle
Ausgangslage spGap: 9.603 Fälle

Für den Merge über Id_t splink erhalte ich folgendes Ergebnis:
not matched from master: 81.619
not matched from using: 46
matched: 9.557

Nachdem ich die 46 Fälle gedropt habe, erhielt ich nicht die erwarteten 90.153 Fälle, sondern 91.176 Fälle. Die Differenz von 13 Fällen kann ich mir nicht erklären. Sie führt dazu, dass ich weitere Spell-Datensätze nicht an den Datensatz mergen kann, da ID_t und splink nicht mehr eindeutig identifizieren.

Auch eine Variable, die ich vor dem merge für alle Bio-Fälle generiere, hat vor dem merge 90.153 und nach dem merge 90.176 Fälle. Gibt es eine Möglichkeit, dieses Problem zu beheben bzw. diese 13 Fälle zu identifizieren?

Vielen Dank für den Support und liebe Grüße,
Andreas

Lieber Andreas,

um die Spelldatensätze eindeutig an den Biography mergen zu können, müssen die Spelldatensätze im Vorfeld mit keep if subspell==0 aufbereitet werden, da ansonsten sowohl die ursprünglichen Teilspells als auch die daraus generierten harmonisierten Spells enthalten sind.

 

Viele Grüße

Nadine

Liebe Nadine,

vielen lieben Dank für die Antwort, das hat einwandfrei geklappt.

 

Viele Grüße,

A.