Guten Tag,
ich möchte die Variablen zur Zeitverwendung nutzen aus dem SOEP-Personenfragebogen.
Es handelt sich um folgende Frage (z.B: Fragebogen 2022):
“Wie sieht gegenwärtig Ihr normaler Alltag aus? Wie viele Stunden pro Tag entfallen bei Ihnen an einem durchschnittlichen Werktag auf die folgenden Tätigkeiten?”
Dort werden im Anschluss verschiedenste Tätigkeiten der Zeitverwendung abgefragt, die Abfrage erfolgt in ganzen Stunden pro durchschnittlichem Werktag. Die Tätigkeiten sind Berufstätigkeit/Lehre inkl. Arbeitsweg, Besorgungen, Hausarbeit, Kinderbetreuung, Versorgung/Betreuung Pflegebedürftiger, Aus-/Weiterbildung, Reparaturen, körperliche Aktivitäten, sonstige Freizeitbeschäftigungen/Hobbies. Zudem wird die Zeit in Stunden abgefragt, die auf Schlaf entfällt. Nachdem ich für jede Beobachtung die Gesamtsumme aller Tätigkeiten gebildet habe, ist mir aufgefallen, dass sowohl unplausible hohe Werte als auch deutlich zu niedrige Werte dabei herauskommen (z.B. 24h allein durch Schlaf). Meine Frage ist daher, ob diese Zeitabfragen in der Summe 24h ergeben sollen, oder ob es ggf. Tätigkeiten gibt, die nicht mit abgedeckt sind (z.B. Essen) und daher die 24 Stunden-Referenzzeit (ein Tag) als Plausibilitätscheck eher nicht geeignet ist? Auch befinden sich einzelne Beobachtungen im Datenset, die Komma-Angaben aufweisen, obwohl eigentlich nur nach ganzen Stunden gefragt wurde. Können diese ganz normal verwendet werden?
Gibt es darüber hinaus eine empfohlene und allgemeingültige Strategie, wie diese Zeitangaben aufbereitet werden sollten, damit man mit ihnen arbeiten kann, also beispielweise der Ausschluss von unplausiblen Werten bis zu einer bestimmten Grenze oder die Imputation von Werten (bspw. ein erwerbstätiges Individuum, welches als Arbeitszeit 0 angegeben hat)?
Ich wäre sehr dankbar um jegliche Rückmeldung!
Liebe Grüße, André