Co to jest wielokoliniowość?
Wielokoliniowość to występowanie wysokich wzajemnych korelacji między zmiennymi niezależnymi w modelu regresji wielokrotnej. Wielokoliniowość może prowadzić do wypaczonych lub wprowadzających w błąd wyników, gdy badacz lub analityk próbuje ustalić, jak dobrze każdą niezależną zmienną można najskuteczniej wykorzystać do przewidywania lub zrozumienia zmiennej zależnej w modelu statystycznym. Ogólnie wielokoliniowość może prowadzić do szerszych przedziałów ufności i mniej wiarygodnych wartości prawdopodobieństwa dla zmiennych niezależnych. Oznacza to, że wnioskowania statystyczne z modelu o wielokoliniowości mogą być niewiarygodne.
Zrozumienie wielokoliniowości
Analitycy statystyczni wykorzystują modele regresji wielokrotnej do przewidywania wartości określonej zmiennej zależnej na podstawie wartości dwóch lub więcej zmiennych niezależnych. Zmienna zależna jest czasami określana jako zmienna wyniku, celu lub kryterium. Przykładem jest model regresji wielowymiarowej, który próbuje przewidywać zwroty akcji na podstawie takich pozycji, jak stosunek ceny do zysku, kapitalizacja rynkowa, wyniki historyczne lub inne dane. Zwrot akcji jest zmienną zależną, a różne bity danych finansowych są zmiennymi niezależnymi.
Kluczowe dania na wynos
- Wieloliniowość jest pojęciem statystycznym, w którym skorelowane są zmienne niezależne w modelu Wieloliniowość między zmiennymi niezależnymi spowoduje mniej wiarygodne wnioskowania statystyczne Lepiej jest używać zmiennych niezależnych, które nie są skorelowane lub powtarzalne, przy budowaniu modeli regresji wielokrotnej, które wykorzystują dwie lub więcej zmiennych.
Wielokoliniowość w modelu regresji wielokrotnej wskazuje, że zmienne niezależne współliniowe są w pewien sposób powiązane, chociaż związek może, ale nie musi być przypadkowy. Na przykład wyniki osiągane w przeszłości mogą być związane z kapitalizacją rynku, ponieważ akcje, które osiągnęły dobre wyniki w przeszłości, będą miały rosnące wartości rynkowe. Innymi słowy, wielokoliniowość może istnieć, gdy dwie niezależne zmienne są wysoce skorelowane. Może się to również zdarzyć, jeśli zmienna niezależna zostanie obliczona na podstawie innych zmiennych w zbiorze danych lub jeśli dwie zmienne niezależne zapewnią podobne i powtarzalne wyniki.
Jednym z najczęstszych sposobów wyeliminowania problemu wielokoliniowości jest najpierw identyfikacja zmiennych niezależnych współliniowych, a następnie usunięcie wszystkich oprócz jednej. Możliwe jest również wyeliminowanie wielokoliniowości poprzez połączenie dwóch lub więcej zmiennych współliniowych w jedną zmienną. Następnie można przeprowadzić analizę statystyczną w celu zbadania związku między określoną zmienną zależną a tylko jedną zmienną niezależną.
Przykład wielokoliniowości
W przypadku inwestycji multikolinearność jest często brana pod uwagę podczas przeprowadzania analizy technicznej w celu przewidywania prawdopodobnych przyszłych zmian cen papierów wartościowych, takich jak akcje lub towary przyszłości. Analitycy rynku chcą unikać stosowania wskaźników technicznych, które są współliniowe, ponieważ opierają się na bardzo podobnych lub powiązanych danych wejściowych; ujawniają podobne prognozy dotyczące zmiennej zależnej ruchu cen. Zamiast tego analiza rynku musi opierać się na wyraźnie różnych zmiennych niezależnych, aby zapewnić, że analizują rynek z różnych niezależnych analitycznych punktów widzenia.
Znany analityk techniczny John Bollinger, twórca wskaźnika Bollinger Bands, zauważa, że „główna zasada skutecznego stosowania analizy technicznej wymaga unikania wielokoliniowości wśród wskaźników”.
Aby rozwiązać problem, analitycy unikają używania dwóch lub więcej wskaźników technicznych tego samego typu. Zamiast tego analizują zabezpieczenia przy użyciu jednego rodzaju wskaźnika, takiego jak wskaźnik pędu, a następnie przeprowadzają oddzielną analizę przy użyciu innego rodzaju wskaźnika, takiego jak wskaźnik trendu.
Przykładem potencjalnego problemu wielokoliniowości jest przeprowadzanie analizy technicznej tylko przy użyciu kilku podobnych wskaźników, takich jak stochastyka, wskaźnik siły względnej (RSI) i Williams% R, które wszystkie są wskaźnikami pędu, które opierają się na podobnych danych wejściowych i prawdopodobnie wytwarzają podobne wyniki. W takim przypadku lepiej jest usunąć wszystkie wskaźniki oprócz jednego lub znaleźć sposób na połączenie kilku z nich w jeden wskaźnik, a także dodanie wskaźnika trendu, który prawdopodobnie nie będzie silnie skorelowany ze wskaźnikiem pędu.