Co to jest czynnik inflacyjny wariancji?
Inflacja wariancji f Czynnik inflacji wariancji (VIF) jest miarą ilości wielokoliniowości w zbiorze zmiennych regresji wielokrotnej. Matematycznie VIF dla zmiennej modelu regresji jest równy stosunkowi ogólnej wariancji modelu do wariancji modelu, który zawiera tylko tę pojedynczą zmienną niezależną. Ten stosunek jest obliczany dla każdej zmiennej niezależnej. Wysoka VIF wskazuje, że powiązana zmienna niezależna jest wysoce współliniowa z innymi zmiennymi w modelu.
Kluczowe dania na wynos
- Współczynnik inflacji wariancji (VIF) stanowi miarę wielokoliniowości między zmiennymi niezależnymi w modelu regresji wielokrotnej. Wykrywanie wielokoliniowości jest ważne, ponieważ chociaż nie zmniejsza mocy wyjaśniającej modelu, zmniejsza istotność statystyczną zmiennych niezależnych. Duże VIF na zmiennej niezależnej wskazuje na wysoce współliniowy związek z innymi zmiennymi, które należy wziąć pod uwagę lub skorygować w strukturze modelu i wyborze zmiennych niezależnych.
Zrozumienie współczynnika inflacji wariancji
Regresja wielokrotna jest stosowana, gdy osoba chce przetestować wpływ wielu zmiennych na konkretny wynik. Zmienna zależna jest wynikiem, na który wpływają zmienne niezależne, które są danymi wejściowymi do modelu. Wielokoliniowość występuje, gdy istnieje relacja liniowa lub korelacja między jedną lub większą liczbą niezależnych zmiennych lub danych wejściowych. Wielokoliniowość stwarza problem w regresji wielokrotnej, ponieważ ponieważ wszystkie dane wejściowe wpływają na siebie nawzajem, nie są one faktycznie niezależne i trudno jest przetestować, w jakim stopniu kombinacja zmiennych niezależnych wpływa na zmienną zależną lub wynik w modelu regresji. W kategoriach statystycznych model regresji wielokrotnej, w którym występuje wysoka wielokoliniowość, utrudni oszacowanie zależności między każdą zmienną niezależną a zmienną zależną. Niewielkie zmiany w wykorzystanych danych lub w strukturze równania modelu mogą powodować duże i nieregularne zmiany szacowanych współczynników zmiennych niezależnych.
Aby upewnić się, że model jest poprawnie określony i działa poprawnie, istnieją testy, które można uruchomić dla wielokoliniowości. Jednym z takich narzędzi pomiarowych jest współczynnik inflacji wariancji. Zastosowanie współczynników inflacji wariancji pomaga zidentyfikować dotkliwość wszelkich problemów związanych z wielokoliniowością, aby umożliwić dostosowanie modelu. Współczynnik inflacji wariancji mierzy, na ile wpływ na zachowanie (wariancja) zmiennej niezależnej ma wpływ lub jej zawyżenie przez jej interakcję / korelację z innymi zmiennymi niezależnymi. Czynniki inflacyjne wariancji pozwalają szybko zmierzyć, ile zmienna przyczynia się do błędu standardowego w regresji. Gdy występują znaczące problemy wielokoliniowości, współczynnik inflacji wariancji będzie bardzo duży dla zaangażowanych zmiennych. Po zidentyfikowaniu tych zmiennych można zastosować kilka metod eliminacji lub łączenia zmiennych współliniowych, co rozwiązuje problem wielokoliniowości.
Chociaż wielokoliniowość nie zmniejsza ogólnej mocy predykcyjnej modelu, może generować oszacowania współczynników regresji, które nie są istotne statystycznie. W pewnym sensie można to uznać za rodzaj podwójnego liczenia w modelu. Gdy dwie lub więcej zmiennych niezależnych jest blisko spokrewnionych lub mierzy prawie to samo, to efekt, który mierzą, jest rozliczany dwukrotnie (lub więcej) we wszystkich zmiennych, i trudno jest powiedzieć, która zmienna naprawdę wpływa na zmienna niezależna. Jest to problem, ponieważ celem wielu modeli ekonometrycznych jest przetestowanie dokładnie tego rodzaju zależności statystycznej między zmiennymi niezależnymi a zmienną zależną.
Na przykład, jeśli ekonomista chce sprawdzić, czy istnieje statystycznie istotny związek między stopą bezrobocia (jako zmienną niezależną) a stopą inflacji (jako zmienną zależną). Uwzględnienie dodatkowych niezależnych zmiennych związanych ze stopą bezrobocia, takich jak nowe wnioski o bezrobocie, prawdopodobnie wprowadziłoby do modelu wielokoliniowość. Ogólny model może wykazywać silną, statystycznie wystarczającą siłę wyjaśniającą, ale nie będzie w stanie określić, czy efekt jest głównie spowodowany stopą bezrobocia lub nowymi początkowymi roszczeniami dla bezrobotnych. To właśnie wykryłby VIF i sugerowałoby to prawdopodobnie usunięcie jednej ze zmiennych z modelu lub znalezienie sposobu na ich skonsolidowanie w celu uchwycenia ich wspólnego efektu, w zależności od konkretnej hipotezy, którą badacz jest zainteresowany testowaniem.