Co to jest regresja krokowa?
Analiza regresji jest szeroko stosowanym podejściem statystycznym, które ma na celu identyfikację związków między zmiennymi. Chodzi o gromadzenie odpowiednich danych w celu podejmowania bardziej świadomych decyzji i jest to powszechna praktyka w świecie inwestowania. Regresja krokowa to iteracyjna konstrukcja modelu regresji krok po kroku, która obejmuje automatyczny wybór zmiennych niezależnych. Dostępność pakietów oprogramowania statystycznego umożliwia regresję krokową, nawet w modelach z setkami zmiennych.
Rodzaje regresji krokowej
Podstawowym celem regresji krokowej jest, poprzez serię testów (testy F, testy t), znalezienie zestawu zmiennych niezależnych, które znacząco wpływają na zmienną zależną. Odbywa się to za pomocą iteracji, która jest procesem dochodzenia do wyników lub decyzji poprzez powtarzane rundy lub cykle analizy. Automatyczne przeprowadzanie testów za pomocą pakietów oprogramowania statystycznego ma tę zaletę, że pozwala oszczędzić czas.
Kluczowe dania na wynos
- Analiza regresji jest podejściem statystycznym, które ma na celu zrozumienie i pomiar związków między zmiennymi niezależnymi i zależnymi. Regresja progresywna to metoda, która bada istotność statystyczną każdej zmiennej niezależnej w modelu. Metoda selekcji do przodu dodaje zmienną, a następnie sprawdza istotność statystyczną Metoda eliminacji wstecznej rozpoczyna się od modelu załadowanego wieloma zmiennymi, a następnie usuwa jedną zmienną, aby sprawdzić jej istotność w stosunku do ogólnych wyników. Regresja progresywna ma wielu krytyków, ponieważ jest to podejście, które dopasowuje dane do modelu w celu osiągnięcia pożądanego rezultatu.
Regresję krokową można osiągnąć albo wypróbowując jedną zmienną niezależną na raz i włączając ją do modelu regresji, jeżeli jest ona statystycznie istotna, lub włączając wszystkie potencjalne zmienne niezależne do modelu i eliminując te, które nie są istotne statystycznie. Niektóre używają kombinacji obu metod, dlatego istnieją trzy podejścia do regresji krokowej:
- Selekcja do przodu rozpoczyna się bez żadnych zmiennych w modelu, testuje każdą zmienną w miarę dodawania do modelu, a następnie zachowuje te, które są uważane za najbardziej istotne statystycznie - powtarzając proces, aż wyniki będą optymalne. Eliminacja wsteczna rozpoczyna się od zestawu zmiennych niezależnych, usuwanie pojedynczo, a następnie sprawdzanie, czy usunięta zmienna jest istotna statystycznie. Eliminacja dwukierunkowa jest kombinacją dwóch pierwszych metod, które sprawdzają, które zmienne należy uwzględnić lub wykluczyć.
Przykładem regresji krokowej z wykorzystaniem metody eliminacji wstecznej byłaby próba zrozumienia zużycia energii w fabryce przy użyciu zmiennych, takich jak czas pracy sprzętu, wiek sprzętu, wielkość personelu, temperatura na zewnątrz i pora roku. Model obejmuje wszystkie zmienne - a następnie każda z nich jest usuwana pojedynczo, aby ustalić, która z nich jest najmniej istotna statystycznie. Ostatecznie model może pokazywać, że pora roku i temperatury są najbardziej znaczące, co może sugerować, że szczytowe zużycie energii w fabryce występuje wtedy, gdy użycie klimatyzatora jest najwyższe.
Ograniczenia regresji krokowej
Analiza regresji, zarówno liniowa, jak i wielowymiarowa, jest dziś szeroko stosowana w świecie inwestycji. Chodzi o to, by często znaleźć wzorce, które istniały w przeszłości i które mogą się powtórzyć w przyszłości. Prosta regresja liniowa może na przykład analizować stosunek ceny do zysku i zwrotów akcji przez wiele lat, aby ustalić, czy zapasy o niskim stosunku P / E (zmienna niezależna) oferują wyższe zwroty (zmienna zależna). Problem z tym podejściem polega na tym, że warunki rynkowe często się zmieniają, a relacje utrzymywane w przeszłości niekoniecznie są prawdziwe w teraźniejszości lub przyszłości.
Tymczasem proces regresji krokowej ma wielu krytyków, a nawet pojawiają się wezwania do zaprzestania stosowania tej metody. Statystycy zauważają kilka wad tego podejścia, w tym niepoprawne wyniki, nieodłączne odchylenie samego procesu oraz konieczność znacznej mocy obliczeniowej do opracowania złożonych modeli regresji poprzez iterację.