Co to jest heteroskedastyczność?
W statystykach heteroskedastyczność (lub heteroscedastyczność) ma miejsce, gdy standardowe błędy zmiennej, monitorowane przez określony czas, nie są stałe. W przypadku heteroskedastyczności znakiem rozpoznawczym po wizualnej kontroli błędów resztkowych jest to, że z czasem będą się one rozkładać, jak pokazano na poniższym obrazie.
Heteroskedastyczność często pojawia się w dwóch formach: warunkowej i bezwarunkowej. Warunkowa heteroskedastyczność identyfikuje niestałą zmienność, gdy nie można zidentyfikować przyszłych okresów wysokiej i niskiej zmienności. Bezwarunkowa heteroskedastyczność jest stosowana, gdy można zidentyfikować okresy wysokiej i niskiej zmienności w kontraktach terminowych.
Zdjęcie Julie Bang © Investopedia 2019
Kluczowe dania na wynos
- W statystykach heteroskedastyczność (lub heteroscedastyczność) ma miejsce, gdy standardowe błędy zmiennej, monitorowane przez określony czas, nie są stałe. W przypadku heteroskedastyczności charakterystycznym znakiem po wizualnej kontroli błędów resztkowych jest tendencja z upływem czasu, jak pokazano na poniższym obrazie. Heteroskedastyczność jest pogwałceniem założeń dotyczących modelowania regresji liniowej, a zatem może mieć wpływ na ważność analizy ekonometrycznej lub modeli finansowych, takich jak CAPM.
Chociaż heteroskedastyczność nie powoduje stronniczości w oszacowaniach współczynników, czyni ją mniej dokładną; niższa precyzja zwiększa prawdopodobieństwo, że szacunki współczynników są dalsze od prawidłowej wartości populacji.
Podstawy heteroterapii
W finansach warunkowa heteroskedastyczność jest często postrzegana w cenach akcji i obligacji. Poziomu zmienności tych akcji nie można przewidzieć w żadnym okresie. Bezwarunkowa heteroskedastyczność może być stosowana podczas omawiania zmiennych, które mają możliwą do zidentyfikowania zmienność sezonową, takich jak zużycie energii elektrycznej.
Odnosząc się do statystyki, heteroskedastyczność (również pisownia heteroscedastyczność) odnosi się do wariancji błędu lub zależności rozproszenia w ramach co najmniej jednej niezależnej zmiennej w ramach określonej próbki. Zmian tych można użyć do obliczenia marginesu błędu między zestawami danych, takimi jak oczekiwane wyniki i rzeczywiste wyniki, ponieważ zapewnia on pomiar odchylenia punktów danych od wartości średniej.
Aby zestaw danych mógł zostać uznany za istotny, większość punktów danych musi mieścić się w określonej liczbie odchyleń standardowych od średniej opisanej w twierdzeniu Czebyszewa, znanym również jako nierówność Czebyszewa. Zapewnia to wytyczne dotyczące prawdopodobieństwa, że zmienna losowa różni się od średniej.
Na podstawie określonej liczby odchyleń standardowych istnieje prawdopodobieństwo, że w losowych punktach istnieje zmienna losowa. Na przykład może być wymagane, aby zakres dwóch odchyleń standardowych zawierał co najmniej 75% punktów danych, aby uznać je za prawidłowe. Powszechną przyczyną odchyleń poza minimalne wymagania często przypisuje się problemy z jakością danych.
Przeciwieństwo heteroskedastyczne jest homoskedastyczne. Homoskedastyczność odnosi się do stanu, w którym wariancja rezydualnego składnika jest stała lub prawie taka sama. Homoskedastyczność jest jednym z założeń modelowania regresji liniowej. Homoskedastyczność sugeruje, że model regresji może być dobrze zdefiniowany, co oznacza, że zapewnia on dobre wyjaśnienie działania zmiennej zależnej.
Typy Heteroskedastyczność
Bezwarunkowy
Bezwarunkowa heteroskedastyczność jest przewidywalna i najczęściej dotyczy zmiennych o charakterze cyklicznym. Może to obejmować wyższą sprzedaż detaliczną zgłoszoną podczas tradycyjnego świątecznego okresu zakupów lub wzrost liczby wezwań do naprawy klimatyzatora w cieplejszych miesiącach.
Zmiany w wariancji można powiązać bezpośrednio z wystąpieniem określonych zdarzeń lub markerów predykcyjnych, jeśli zmiany nie są tradycyjnie sezonowe. Może to być związane ze wzrostem sprzedaży smartfonów wraz z wydaniem nowego modelu, ponieważ aktywność jest cykliczna w zależności od wydarzenia, ale niekoniecznie zależy od sezonu.
Warunkowy
Z natury warunkowa heteroskedastyczność nie jest przewidywalna. Nie ma wyraźnego znaku, który skłania analityków do przekonania, że dane staną się mniej lub bardziej rozproszone w dowolnym momencie. Często produkty finansowe są uważane za podlegające warunkowej heteroskedastyczności, ponieważ nie wszystkie zmiany można przypisać konkretnym wydarzeniom lub zmianom sezonowym.
Uwagi specjalne
Heteroskedastyczność i modelowanie finansowe
Heteroskedastyczność jest ważną koncepcją w modelowaniu regresji, aw świecie inwestycyjnym modele regresji służą do wyjaśnienia wyników papierów wartościowych i portfeli inwestycyjnych. Najbardziej znanym z nich jest model wyceny aktywów kapitałowych (CAPM), który wyjaśnia wyniki akcji pod względem zmienności w stosunku do całego rynku. Rozszerzenia tego modelu dodały inne zmienne predykcyjne, takie jak rozmiar, pęd, jakość i styl (wartość kontra wzrost).
Te zmienne predykcyjne zostały dodane, ponieważ wyjaśniają lub uwzględniają wariancję zmiennej zależnej. Wyniki portfela są wyjaśnione przez CAPM. Na przykład twórcy modelu CAPM zdawali sobie sprawę, że ich model nie wyjaśnił interesującej anomalii: zapasy wysokiej jakości, które były mniej zmienne niż zapasy niskiej jakości, zwykle osiągały lepsze wyniki niż przewidywano w modelu CAPM. CAPM mówi, że zapasy o wyższym ryzyku powinny przewyższać zapasy o niższym ryzyku. Innymi słowy, zapasy o dużej zmienności powinny pokonać zapasy o niższej zmienności. Jednak akcje o wysokiej jakości, które są mniej zmienne, zwykle osiągają lepsze wyniki niż przewidywane przez CAPM.
Później inni badacze rozszerzyli model CAPM (który został już rozszerzony o inne zmienne predykcyjne, takie jak rozmiar, styl i pęd), aby uwzględnić jakość jako dodatkową zmienną predykcyjną, znaną również jako „czynnik”. Po uwzględnieniu tego czynnika w modelu uwzględniono anomalię wyników akcji o niskiej zmienności. Modele te, zwane modelami wieloczynnikowymi, stanowią podstawę inwestowania czynnikowego i inteligentnej wersji beta.
