Anzahl der Fahrzeuge je Haushalt (2023) hli0005 und hlf0691

Liebes SOEP-Team,

ich habe eine Frage zu den Variablen hli0005 und hlf0691 aus dem hl-Datensatz für das Umfragejahr 2023.

hli0005 fragt die Anzahl der Fahrzeuge je Haushalt ab. Gerade mal 155 der Haushalte geben an, dass Sie kein Fahrzeug besitzen.

hlf0691 ist die nachgeschaltete Frage, die den Grund abfragt, warum sich Haushalte gegen den Besitz eines Fahrzeuges entschieden haben. Im SOEP-Core – 2023: Haushalt (techn., mit Verweis auf Variablen) wird als Bedingung zur Freischaltung der Frage (18;hlf0001_v3=1:3,1)&(40;hli0005=0) genannt. hli0005=0 haben jedoch nur 155 Haushalte angegeben, dennoch geben 3473 Haushalte unter hlf0691 einen Grund für ihre Fahrzeuglosigkeit an, was im Rückschluss bedeuten würde, dass diese eigentlich hli0005=0 hätten angeben müssen.

hl %>%
+   filter(syear == 2023) %>%
+   summarise(HH_mit_0_Fahrzeugen = sum(hli0005==0, na.rm = T),
+             HH_Grund_für_0_Fahrzeuge = sum(hlf0691>0, na.rm = T))
# A tibble: 1 × 2
  HH_mit_0_Fahrzeugen HH_Grund_für_0_Fahrzeuge
                <int>                    <int>
1                 155                     3473

Wäre es in diesem Fall valide anzunehmen, dass die Haushalte, die einen Grund in hlf0691 für ihre Fahrzeuglosigkeit angegeben haben, als fahrzeuglos zu definieren?

Außerdem wundere ich mich über den hohen Anteil der Haushalte, bei denen die Frage nach der Anzahl der Fahrzeuge in der Fragebogenversion nicht enthalten war (entsprechend hli0005 gleich -5 gesetzt wird). Hat das einen bestimmten Grund? Muss ich bestimmt Sachen bei der Verwendung dieser Variablen beachten? Denn die Haushalte, die nicht befragt wurden, haben ein systematisch niedrigeres Äquivalenzeinkommen, sodass die Verteilung nicht repräsentativ sein könnte. Da ich die Verteilungseffekte des CO2 Preises (auf Kraftstoffnutzung) analysiere, sind die Ergebnisse maßgeblich von der Struktur von hli0005 und hlf0691 abhängig.

 hl %>%
+   filter(syear == 2023) %>%
+   count(hli0005)
# A tibble: 19 × 2
   hli0005     n
     <dbl> <int>
 1      -5  5830
 2      -2  3351
 3      -1   301
 4       0   155
 5       1  5437
 6       2  3217
 7       3   811
 8       4   287
 9       5    88
.
.
.

Liebe Grüße und vielen Danke im Voraus,

Lisa