Spis treści
- Wzór na korelację
- Typowe błędy w korelacji
- Znajdowanie korelacji w programie Excel
Korelacja mierzy zależność liniową dwóch zmiennych. Poprzez pomiar i powiązanie wariancji każdej zmiennej korelacja wskazuje na siłę zależności. Innymi słowy, korelacja odpowiada na pytanie: ile zmienna A (zmienna niezależna) wyjaśnia zmienną B (zmienną zależną)?
Kluczowe dania na wynos
- Korelacja to statystyczna liniowa zgodność zmienności między dwiema zmiennymi. W finansach korelacja jest wykorzystywana w kilku aspektach analizy, w tym w obliczeniach lub odchyleniu standardowym portfela. Korelacja obliczeniowa może być czasochłonna, ale oprogramowanie takie jak Excel ułatwia obliczenia.
Wzór na korelację
Korelacja łączy kilka ważnych i powiązanych pojęć statystycznych, a mianowicie wariancję i odchylenie standardowe. Wariancja jest rozproszeniem zmiennej wokół średniej, a odchylenie standardowe jest pierwiastkiem kwadratowym wariancji.
Formuła jest następująca:
Ponieważ korelacja chce ocenić relację liniową dwóch zmiennych, naprawdę wymagane jest sprawdzenie, jaki stopień kowariancji mają te dwie zmienne i do jakiego stopnia ta kowariancja jest odzwierciedlona przez odchylenia standardowe każdej zmiennej indywidualnie.
Typowe błędy w korelacji
Najczęstszym błędem jest założenie, że korelacja zbliżająca się do +/- 1 jest statystycznie istotna. Czytanie zbliżające się do +/- 1 zdecydowanie zwiększa szanse na faktyczne znaczenie statystyczne, ale bez dalszych testów nie można tego ustalić. Testy statystyczne korelacji mogą się komplikować z wielu powodów; to wcale nie jest proste. Krytycznym założeniem korelacji jest to, że zmienne są niezależne i że związek między nimi jest liniowy. Teoretycznie przetestowałbyś te twierdzenia, aby ustalić, czy obliczenie korelacji jest odpowiednie.
Pamiętaj, że korelacja między dwiema zmiennymi NIE oznacza, że A spowodował B lub odwrotnie.
Drugim najczęstszym błędem jest zapominanie o normalizacji danych we wspólnej jednostce. Jeśli oblicza się korelację na dwóch betach, wówczas jednostki są już znormalizowane: sama beta jest jednostką. Jeśli jednak chcesz skorelować akcje, ważne jest, aby normalizować je w procentach zwrotu, a nie zmieniać ceny akcji. Zdarza się to zbyt często, nawet wśród profesjonalistów inwestycyjnych.
W przypadku korelacji ceny akcji zasadniczo zadajesz dwa pytania: Jaki jest zwrot z określonej liczby okresów i jak ten zwrot koreluje z zwrotem innego papieru wartościowego w tym samym okresie? Dlatego też korelacja cen akcji jest trudna: dwa papiery wartościowe mogą mieć wysoką korelację, jeśli zwrot to dzienne zmiany procentowe w ciągu ostatnich 52 tygodni, ale niską korelację, jeśli zwrot jest zmianą miesięczną w ciągu ostatnich 52 tygodni. Który jest lepszy"? Naprawdę nie ma idealnej odpowiedzi i zależy to od celu testu.
Znajdowanie korelacji w programie Excel
Istnieje kilka metod obliczania korelacji w programie Excel. Najprościej jest uzyskać dwa zestawy danych obok siebie i użyć wbudowanej formuły korelacji:
Jest to wygodny sposób na obliczenie korelacji między tylko dwoma zestawami danych. Ale co, jeśli chcesz utworzyć macierz korelacji dla szeregu zestawów danych? Aby to zrobić, musisz użyć wtyczki Excel Data Analysis. Wtyczkę można znaleźć na karcie Dane w obszarze Analizuj.
Wybierz tabelę zwrotów. W takim przypadku nasze kolumny są zatytułowane, dlatego chcemy zaznaczyć pole „Etykiety w pierwszym rzędzie”, aby Excel wiedział, że traktuje je jak tytuły. Następnie możesz wybrać wydruk na tym samym arkuszu lub na nowym arkuszu.
Po wciśnięciu Enter dane są tworzone automatycznie. Możesz dodać tekst i formatowanie warunkowe, aby wyczyścić wynik.