Z reguły, jeśli brakuje mniej niż 5% obserwacji, brakujące dane można po prostu usunąć bez żadnych istotnych konsekwencji (3).
- Jaki procent brakujących danych jest dopuszczalny?
- Ile brakujących danych jest dopuszczalne dla pojedynczej imputacji?
- Jak radzisz sobie z 50% brakującymi danymi?
Jaki procent brakujących danych jest dopuszczalny?
Ile brakuje danych? Ważny jest ogólny procent braku danych. Zasadniczo, jeśli brakuje mniej niż 5% wartości, dopuszczalne jest ich ignorowanie (Ref).
Ile brakujących danych jest dopuszczalne dla pojedynczej imputacji?
Scheffer (2002) sugeruje, że pełne przypadki można zastosować, jeśli nie ma więcej niż 6% danych, pojedynczy imputacja, jeśli nie ma więcej niż 10% danych, i bardziej złożone procedury, takie jak wielokrotne przypisanie, jeżeli między 10% a 25% brakuje danych.
Jak radzisz sobie z 50% brakującymi danymi?
Uruchom modele predykcyjne, które przypisują brakujące dane. Należy to zrobić w połączeniu z pewnym schematem walidacji krzyżowej, aby uniknąć wycieku. Może to być bardzo skuteczne i może pomóc w końcowym modelu. Użyj liczby brakujących wartości w danym wierszu, aby utworzyć nową funkcję zaprojektowaną.