Ich möchte das Sample von 2002 bis 2018 konsistent halten und deshalb die Lohnsteuerfälle die ab 2012 mit drin sind wieder herausfiltern, d.h. ich möchte nur Steuerzahler behalten die explizit eine Steuererklärung abgeben.
Nach meinem Verständnis kann ich das erreichen indem ich Fälle ausschließe bei denen die Variable ef1 mit einem Wert größer/gleich 6 annimmt. Ist das richtig oder sollten die Lohnsteuerfälle anders herausgefiltert werden?
Ja, das ist korrekt. Mit ef1 = [6, 9, 10, 18] sollten sämtliche Lohnsteuerfälle rausgefiltert werden und dann nur die Steuerpflichtigen enthalten sein, die eine Steuererklärung eingereicht haben.
Zur Präzisierung ergänzend zum Ursprungspost noch ein Hinweis aus der Fachabteilung:
"Verlustfestsetzungen (ef1=09) und Nur-Sparzulagenfälle (ef1=06) gelten als veranlagte Steuerpflichtige. Sie geben auch eine verkürzte Steuererklärung ab. Lohnsteuerfälle haben den Merker ef1=18 (Wohnsitz im Inland) oder ef1=10 (Wohnsitz im Ausland).
Im TPP fehlten bis 2012 aber auch die Verlustfestsetzungen und Nur-Sparzulagenfälle. Um die Zusammensetzung im Panel einheitlich zu halten, ist ein Ausschluss der Datensätze mit ef1 größer/gleich 06 also vollkommen richtig. Da der Merker alphanumerisch ist, ist eine Liste der Ausprägungen sicher vorteilhafter: ef1 nicht 06, 09, 10, 18."