ich möchte die beiden Variablen pgnace und pgnace2 (Branche aktueller Beruf) aus dem pgen-Datensatz verwenden. Mir ist aufgefallen, dass pgnace von 1984 bis 2017 Werte hat. Pgnace2 beginnt allerdings schon ab 2013 und reicht bis zur aktuellen Welle. Die beiden Variablen überschneiden sich also für den Zeitraum 2013 bis 2017. Welche Variable sollte ich für diesen Zeitraum verwenden?
Beide Variablen stammen aus der Kodierung der offenen Angabe auf die Frage nach der Branche des Unternehmens, in dem man aktuell erwerbstätig ist. Wie bei solchen Kategoriensystemen üblich, werden sie von Zeit zu Zeit modernisiert. In diesem Fall handelt es sich um NACE Rev 1.1 und Rev 2. Dort jeweils die Gliederungsebene der Abteilungen/Divisions. Im zugehörigen Wikipedia-Artikel findet sich eine ganz gute vergleichende Übersicht und auch Links zu den offiziellen Dokumenten: https://de.wikipedia.org/wiki/Statistische_Systematik_der_Wirtschaftszweige_in_der_Europäischen_Gemeinschaft
In den Daten schlägt sich diese Modernisierung als Bruch in der Zeitreihe nieder, der durch den beobachteten Zeitraum, für den es beide Kategorien gibt, etwas abgemildert wird.
Der Umgang mit diesem Sachverhalt ist von der Forschungsfrage und insbesondere deren zeitlicher Perspektive abhängig.