Wariancja to miara rozproszenia między liczbami w zbiorze danych. Wariancja mierzy, jak daleko każda liczba w zestawie jest od średniej.
Za pomocą wykresu zestawu danych możemy zaobserwować, jaka jest liniowa zależność różnych punktów danych lub liczb. Robimy to, rysując linię regresji, która próbuje zminimalizować odległość dowolnego pojedynczego punktu danych od samej linii. Na poniższym wykresie punktami danych są niebieskie kropki, pomarańczowa linia to linia regresji, a czerwone strzałki to odległość od obserwowanych danych i linii regresji.
Zdjęcie Julie Bang © Investopedia 2020
Obliczając wariancję, pytamy, biorąc pod uwagę związek wszystkich tych punktów danych, ile spodziewamy się odległości w następnym punkcie danych? Ta „odległość” nazywana jest terminem błędu i właśnie to mierzy wariancja.
Sama wariancja często nie jest przydatna, ponieważ nie ma jednostki, co utrudnia zmierzenie i porównanie. Jednak pierwiastek kwadratowy wariancji jest odchyleniem standardowym i jest to zarówno praktyczne jako pomiar.
Obliczanie wariancji w programie Excel
Obliczanie wariancji w programie Excel jest łatwe, jeśli zestaw danych jest już wprowadzony do oprogramowania. W poniższym przykładzie obliczymy wariancję 20 dni dziennych zwrotów w bardzo popularnym funduszu giełdowym (ETF) o nazwie SPY, który inwestuje w S&P 500.
- Formuła to = VAR.S (wybierz dane)
Powodem, dla którego chcesz używać VAR.S, a nie VAR.P (co jest inną oferowaną formułą), jest to, że często nie masz całej populacji danych do pomiaru. Na przykład, gdybyśmy mieli wszystkie zwroty w historii ETF SPY w naszej tabeli, moglibyśmy użyć pomiaru populacji VAR.P, ale ponieważ mierzymy tylko ostatnie 20 dni w celu zilustrowania koncepcji, użyjemy VAR.S.
Jak widać, obliczona wartość wariancji 0, 000018674 sama mówi nam niewiele o zestawie danych. Gdybyśmy przeszli do pierwiastka kwadratowego z tej wartości, aby uzyskać standardowe odchylenie zwrotów, byłoby to bardziej przydatne.