- Czy możesz uruchomić regresję z brakującymi danymi?
- Jak radzisz sobie z brakującymi danymi w regresji?
- Ile brakujących danych jest dopuszczalne do regresji?
Czy możesz uruchomić regresję z brakującymi danymi?
W przypadku analizy regresji domyślnymi we wszystkich programach jest wyeliminowanie wszelkich przypadków z brakującymi danymi na temat dowolnej zmiennej (i.mi., Listowe usunięcie). Wraz ze wzrostem liczby braków danych może wystąpić znaczna redukcja wielkości próby i wynikająca z tego utrata mocy.
Jak radzisz sobie z brakującymi danymi w regresji?
W radzeniu sobie z brakującymi danymi naukowcy danych mogą użyć dwóch podstawowych metod do rozwiązania błędu: imputacji lub usunięcia danych. Metoda imputacji opracowuje rozsądne przypuszczenia dla brakujących danych. Jest to najbardziej przydatne, gdy odsetek brakujących danych jest niski.
Ile brakujących danych jest dopuszczalne do regresji?
Artykuły wytyczne statystyczne stwierdziły, że stronniczość jest prawdopodobnie w analizach z ponad 10% brakiem i że jeśli brakuje więcej niż 40% danych w ważnych zmiennych, wyniki należy uznać tylko za generowanie hipotezy [18], [19].