Wie entscheidet ihr vor der Analyse, wie mit fehlenden Werten umgegangen werden soll?

Ich bin gerade an dem Punkt, an dem ich entscheiden muss, wie ich mit fehlenden Werten umgehen soll, und ich bin mir nicht sicher, ab wann fehlende Werte zu einem echten Datenqualitätsproblem werden und nicht nur zu etwas ganz Routinemäßigem. Ich weiß, dass Listwise Deletion einfach ist, habe aber Sorge, dass dadurch meine Ergebnisse verzerrt werden. Wie entscheidet ihr normalerweise, ob fehlende Daten so problematisch sind, dass man eine andere Strategie braucht?

Ich denke, die entscheidende Frage ist nicht nur, wie viele Werte fehlen, sondern auch, wo Missings auftreten und ob diese systematisch wirken. Schon ein kleiner Anteil an Missings kann ein großes Problem sein, wenn er sich auf eine bestimmte Subgruppe oder auf eine besonders wichtige Variable konzentriert. Umgekehrt kann auch ein größerer Anteil weniger problematisch sein, wenn das Muster eher diffus ist und nicht stark strukturiert wirkt.

Hilfreich ist hier die Unterscheidung zwischen Missing Completely at Random (MCAR), Missing at Random (MAR) und Not Missing at Random (NMAR). Vereinfacht gesagt bedeutet MCAR, dass Missings mit nichts Relevantem zusammenhängen, MAR bedeutet, dass sie mit beobachteten Variablen zusammenhängen, und NMAR bedeutet, dass Missings möglicherweise mit dem fehlenden Wert selbst zusammenhängen. In der Praxis ist diese Einteilung vor allem als Orientierung hilfreich, da man meist nicht mit Sicherheit nachweisen kann, welcher Fall tatsächlich vorliegt.

Praktisch würde ich deshalb zuerst den Umfang und das Muster der fehlenden Werte beschreiben, dann prüfen, ob Missings mit anderen Variablen zusammenhängen, und erst danach über den geeigneten Umgang mit Missings entscheiden .

Wenn Listwise Deletion die Zusammensetzung der Stichprobe oder die Ergebnisse spürbar verändert, wäre ich vorsichtig, sie einfach standardmäßig zu verwenden. In solchen Fällen können Imputation oder modellbasierte Verfahren sinnvoller sein, je nach Studiendesign und Forschungsfrage. Selbst wenn man sich am Ende für eine einfache Methode entscheidet, ist es hilfreich zu zeigen, dass man geprüft hat, ob diese Entscheidung einen Unterschied macht.