- Ile wariancji PCA powinien wyjaśnić?
- Co to jest wysokie ładowanie w PCA?
- Czy powinienem usunąć wysoce skorelowane funkcje przed PCA?
- Co mówią nam ładunki PCA?
Ile wariancji PCA powinien wyjaśnić?
Niektóre kryteria mówią, że całkowita wariancja wyjaśniona przez wszystkie komponenty powinna wynosić od 70% do 80% wariancji, co w tym przypadku oznaczałoby około czterech do pięciu składników.
Co to jest wysokie ładowanie w PCA?
Ładunki pochodzą z liczbowego punktu widzenia, równego współczynnikom zmiennych, i dostarczają informacji o tym, które zmienne dają największy wkład w komponenty. Ładunki wahają się od -1 do 1. Wysoka wartość bezwzględna (w kierunku 1 lub -1) opisuje, że zmienna silnie wpływa na komponent.
Czy powinienem usunąć wysoce skorelowane funkcje przed PCA?
Cześć Yong, PCA jest sposobem na radzenie sobie ze wysoce skorelowanymi zmiennymi, więc nie ma potrzeby ich usuwania. Jeśli n zmienne są wysoce skorelowane, wszystkie załadują się na tym samym głównym komponencie (wektorze własnym), a nie inne. W ten sposób identyfikujesz je jako silnie skorelowane.
Co mówią nam ładunki PCA?
Obciążenia dodatnie wskazują, że zmienna i główny składnik są dodatnio skorelowane: wzrost jednego powoduje wzrost drugiego wzrostu. Obciążenia ujemne wskazują na korelację ujemną. Duże (dodatnie lub ujemne) obciążenia wskazują, że zmienna ma silny wpływ na ten główny składnik.