Datenvergleich Heute vs vor 10 Jahren

Hallo,

in meiner Arbeit möchte ich unter anderem die Ergebnisse eines Papers replizieren, welches mit SOEP Daten arbeitet und 2017 publiziert wurde. In diesem Paper arbeiten sie mit SOEP Daten aus den Jahren 2007 und 2008. Ich habe leider Schwierigkeiten diese Ergebnisse zu replizieren. Schon allein auf die gleiche Sample Größe zu kommen ist zum Beispiel schwierig. Ich bin derzeit auf Fehlersuche (natürlich vor allem in meinem Code!), aber ich wollte fragen, ob es auch damit zu tun haben könnte, dass die SOEP Daten seit 2016 verändert bzw. harmonisiert, korrigiert oder ähnliches wurden? Es geht hier vor allem um die Variable subjektive Gesundheit (z.B. ple0008 oder m11126). Falls ja, sind die alten Versionen noch verfügbar? Im Paper wird SOEP v27 verwendet. Vielen Dank! Das wäre der Link zum Paper für den Fall: https://onlinelibrary.wiley.com/doi/abs/10.1002/hec.3310

Natürlich gibt es seit dieser Datenversion (nach 14 Jahren) einiges an Änderungen. Aber selbst in der aktuellsten Version werden im raw Ordner die querschnittlichen Daten des früheren SOEP Formats noch ausgeliefert. Diese Format haben die Autoren damals wahrscheinlich auch genutzt.

Aber die Sample Größe sollte sich nicht geändert haben, da wir normalerweise keine Fälle rauswerfen. Mit einer Ausnahme in der Version V38.1, wegen im Nachhinein entdeckten Fälschungen.

Die Diskrepanzen sind wahrscheinlich eher eine Frage der Abgrenzungen und der genutzten Variablen, was ohne vorliegende Syntax zugegebenermaßen schwer nachzuvollziehen ist.

Es gibt aber auch die Möglichkeit die Version 27 direkt zu bekommen, dass wird aber (so meine Vermutung) nicht unbedingt das Problem lösen. Dafür bitte mit dem entsprechenden Vertrag an soepmail@diw.de wenden.

Vielen Dank für die Antwort! Das habe ich vermutet , doch ich dachte ich frage mal, ob es in diese Richtung vielleicht auch Erklärungen gibt. Mir fehlt eben diese genaue Syntax der Autoren und ich muss daher von dem was im Paper steht ausgehen, welches für eine genaue Replikation wenig ist. Ich bin derzeit am rumprobieren all möglicher Sample Kriterien. Vielleicht werde ich ja doch noch fündig. :slight_smile: