Anzahl der Fahrzeuge je Haushalt (2023) hli0005 und hlf0691

Liebes SOEP-Team,

ich habe eine Frage zu den Variablen hli0005 und hlf0691 aus dem hl-Datensatz für das Umfragejahr 2023.

hli0005 fragt die Anzahl der Fahrzeuge je Haushalt ab. Gerade mal 155 der Haushalte geben an, dass Sie kein Fahrzeug besitzen.

hlf0691 ist die nachgeschaltete Frage, die den Grund abfragt, warum sich Haushalte gegen den Besitz eines Fahrzeuges entschieden haben. Im SOEP-Core – 2023: Haushalt (techn., mit Verweis auf Variablen) wird als Bedingung zur Freischaltung der Frage (18;hlf0001_v3=1:3,1)&(40;hli0005=0) genannt. hli0005=0 haben jedoch nur 155 Haushalte angegeben, dennoch geben 3473 Haushalte unter hlf0691 einen Grund für ihre Fahrzeuglosigkeit an, was im Rückschluss bedeuten würde, dass diese eigentlich hli0005=0 hätten angeben müssen.

hl %>%
+   filter(syear == 2023) %>%
+   summarise(HH_mit_0_Fahrzeugen = sum(hli0005==0, na.rm = T),
+             HH_Grund_für_0_Fahrzeuge = sum(hlf0691>0, na.rm = T))
# A tibble: 1 × 2
  HH_mit_0_Fahrzeugen HH_Grund_für_0_Fahrzeuge
                <int>                    <int>
1                 155                     3473

Wäre es in diesem Fall valide anzunehmen, dass die Haushalte, die einen Grund in hlf0691 für ihre Fahrzeuglosigkeit angegeben haben, als fahrzeuglos zu definieren?

Außerdem wundere ich mich über den hohen Anteil der Haushalte, bei denen die Frage nach der Anzahl der Fahrzeuge in der Fragebogenversion nicht enthalten war (entsprechend hli0005 gleich -5 gesetzt wird). Hat das einen bestimmten Grund? Muss ich bestimmt Sachen bei der Verwendung dieser Variablen beachten? Denn die Haushalte, die nicht befragt wurden, haben ein systematisch niedrigeres Äquivalenzeinkommen, sodass die Verteilung nicht repräsentativ sein könnte. Da ich die Verteilungseffekte des CO2 Preises (auf Kraftstoffnutzung) analysiere, sind die Ergebnisse maßgeblich von der Struktur von hli0005 und hlf0691 abhängig.

 hl %>%
+   filter(syear == 2023) %>%
+   count(hli0005)
# A tibble: 19 × 2
   hli0005     n
     <dbl> <int>
 1      -5  5830
 2      -2  3351
 3      -1   301
 4       0   155
 5       1  5437
 6       2  3217
 7       3   811
 8       4   287
 9       5    88
.
.
.

Liebe Grüße und vielen Danke im Voraus,

Lisa

Liebe Lisa,

Vielen Dank, dass Sie mit den SOEP Daten arbeiten und sich so in die Daten vertiefen.

Ich habe mir die Variablen erstmal für 2023 genauer angesehen:

bysort instrument: tab hli0005 hlf0691 if syear==2023,m

Die Variable instrument ist da sehr hilfreich:

Die 155 Fälle die 0 Fahrzeuge angegeben haben, kommen alle aus dem Papi-Instrument.

Im technischen Instrument sieht das so aus:

Die große Anzahl -5er aus dem Jahr 2023 kommt aus der Auffrischung M3-M10, unsere IAB-BAMF-SOEP Geflüchteten Stichproben, diese haben die Frage nicht bekommen.

Die 155 Fälle kommen aus dem Papi-Instrument. Im technischen Instrument wurde die 0 auf -2 gesetzt. Da nur ein einziger Filter für diese Frage aktiv ist, siehe Fragebogen,

habe ich mir die hli0005 mit der hlf0001_v3 kreuztabuliert. Die einzigen die wirklich auf -2 sind, also überfiltert wurden, sind die Personen, die in einem Altersheim oder Seniorenheim leben (21 plus eine Person, die auch diese Frage nicht beantwortet hat = 22 Personen die tatsächlich auf -2 stehen. Alle anderen -2 haben mit ziemlicher Sicherheit angegeben eine Anzahl von 0 zu besitzen.

336+3662+765+4335 plus die 155 aus dem Papi-Instrument mit Anzahl = 0 haben angegeben kein Fahrzeug zu besitzen. Es scheint das zusätzlich die Personen die die Angabe bei der Anzahl verweigert haben, die Gründe ausgefüllt haben. Hier kann ich keine Empfehlung zur Anzahl geben.

Wir arbeiten an einer Korrektur dieser Variablen, damit sie einfacher zu nutzen ist. Vielen Dank für den Hinweis und die Nachfrage.

Viele Grüße

Jana Nebelin

1 Like