Formuła rozkładu normalnego opiera się na dwóch prostych parametrach - średniej i odchyleniu standardowym - które określają ilościowo cechy danego zestawu danych. Podczas gdy średnia wskazuje „centralną” lub średnią wartość całego zestawu danych, odchylenie standardowe wskazuje „rozpiętość” lub zmienność punktów danych wokół tej średniej wartości.
Rozważ następujące 2 zestawy danych:
Zestaw danych 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Zestaw danych 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Dla zestawu danych 1 średnia = 10 i odchylenie standardowe (stddev) = 0
Dla zestawu danych 2 średnia = 10 i odchylenie standardowe (stddev) = 2, 83
Narysujmy te wartości dla DataSet1:
Podobnie w przypadku DataSet2:
Czerwona pozioma linia na obu powyższych wykresach wskazuje „średnią” lub średnią wartość każdego zestawu danych (10 w obu przypadkach). Różowe strzałki na drugim wykresie wskazują rozrzut lub zmianę wartości danych od wartości średniej. Jest to reprezentowane przez odchylenie standardowe 2, 83 w przypadku DataSet2. Ponieważ DataSet1 ma wszystkie wartości takie same (po 10) i nie ma zmian, wartość stddev wynosi zero, a zatem nie ma zastosowania różowa strzałka.
Wartość stddev ma kilka znaczących i przydatnych cech, które są niezwykle pomocne w analizie danych. W przypadku rozkładu normalnego wartości danych są symetrycznie rozmieszczone po obu stronach średniej. Dla każdego normalnie rozproszonego zestawu danych, wykreślanie wykresu ze standardowym na osi poziomej i nie. wartości danych na osi pionowej otrzymuje się następujący wykres.
Właściwości rozkładu normalnego
- Krzywa normalna jest symetryczna względem średniej; Średnia znajduje się na środku i dzieli pole na dwie połowy; Całkowite pole pod krzywą jest równe 1 dla średniej = 0 i stdev = 1; Rozkład jest całkowicie opisany przez jego średnią i stddev
Jak widać z powyższego wykresu, stddev reprezentuje:
- 68, 3% wartości danych mieści się w granicach 1 odchylenia standardowego średniej (-1 do +1) 95, 4% wartości danych mieści się w granicach 2 odchyleń standardowych średniej (-2 do +2) 99, 7% wartości danych mieści się w granicach 3 odchyleń standardowych średniej (od -3 do +3)
Obszar pod krzywą w kształcie dzwonu, mierzony, wskazuje pożądane prawdopodobieństwo danego zakresu:
- mniej niż X: - np. prawdopodobieństwo wartości danych mniejsze niż 70 jest większe niż X - np. prawdopodobieństwo wartości danych większe niż 95 między X 1 i X 2 - np. prawdopodobieństwo wartości danych między 65 a 85
gdzie X jest wartością będącą przedmiotem zainteresowania (przykłady poniżej).
Rysowanie i obliczanie obszaru nie zawsze jest wygodne, ponieważ różne zestawy danych będą miały różne wartości średnie i standardowe. Aby ułatwić stosowanie jednolitej standardowej metody w celu łatwych obliczeń i zastosowania w rzeczywistych problemach, wprowadzono standardową konwersję na wartości Z, które stanowią część tabeli rozkładu normalnego.
Z = (X - średnia) / stddev, gdzie X jest zmienną losową.
Zasadniczo ta konwersja wymusza standaryzację średniej i stddev odpowiednio na 0 i 1, co umożliwia stosowanie standardowego zestawu wartości Z (z tabeli rozkładu normalnego) do łatwych obliczeń. Przegląd standardowej tabeli wartości Z zawierającej wartości prawdopodobieństwa jest następujący:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0, 0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0.2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0, 3 |
0, 11791 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0, 4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0, 5 |
0, 19146 |
0, 19497 |
0, 19847 |
0, 20194 |
0, 20540 |
0, 20884 |
… |
0, 6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0, 7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
Aby znaleźć prawdopodobieństwo związane z wartością z 0, 239865, najpierw zaokrągl ją do 2 miejsc po przecinku (tj. 0, 24). Następnie sprawdź pierwsze 2 cyfry znaczące (0, 2) w wierszach i najmniej znaczącą cyfrę (pozostałe 0, 04) w kolumnie. Doprowadzi to do wartości 0, 09483.
Pełną tabelę rozkładu normalnego z dokładnością do 5 miejsc po przecinku dla wartości prawdopodobieństwa (w tym dla wartości ujemnych) można znaleźć tutaj.
Zobaczmy kilka przykładów z życia. Wysokość osobników w dużej grupie jest zgodna z normalnym wzorcem rozmieszczenia. Załóżmy, że mamy zestaw 100 osobników, których wysokości są rejestrowane, a średnia i stddev są obliczane odpowiednio na 66 i 6 cali.
Oto kilka przykładowych pytań, na które można łatwo odpowiedzieć za pomocą tabeli wartości Z:
- Jakie jest prawdopodobieństwo, że osoba w grupie ma 70 cali lub mniej?
Pytanie polega na znalezieniu skumulowanej wartości P (X <= 70), tj. W całym zestawie danych 100, ile wartości będzie między 0 a 70.
Najpierw przekonwertujmy wartość X 70 na równoważną wartość Z.
Z = (X - średnia) / stddev = (70-66) / 6 = 4/6 = 0, 666667 = 0, 67 (zaokrąglić do 2 miejsc po przecinku)
Teraz musimy znaleźć P (Z <= 0, 67) = 0, 24857 (z powyższej tabeli Z)
tj. istnieje 24, 857% prawdopodobieństwa, że osoba w grupie będzie mniejsza lub równa 70 cali.
Ale poczekaj - powyższe jest niekompletne. Pamiętaj, szukamy prawdopodobieństwa wszystkich możliwych wysokości do 70, tj. Od 0 do 70. Powyższe po prostu daje ci część od średniej do pożądanej wartości (tj. 66 do 70). Musimy uwzględnić drugą połowę - od 0 do 66 - aby uzyskać prawidłową odpowiedź.
Ponieważ od 0 do 66 reprezentuje połowę (tj. Jedną średnią skrajną do połowy drogi), jej prawdopodobieństwo wynosi po prostu 0, 5.
Stąd prawidłowe prawdopodobieństwo, że dana osoba ma 70 cali lub mniej = 0, 24857 + 0, 5 = 0, 74857 = 74, 857%
Graficznie (poprzez obliczenie powierzchni) są to dwa zsumowane regiony reprezentujące rozwiązanie:
- Jakie jest prawdopodobieństwo, że dana osoba ma 75 cali lub więcej?
tj. Znajdź uzupełniające skumulowane P (X> = 75).
Z = (X - średnia) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1 P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Jakie jest prawdopodobieństwo, że osoba znajdzie się w przedziale od 52 cali do 67 cali?
Znajdź P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (.40905) =
Ta normalna tabela rozkładu (i wartości z) często znajduje zastosowanie do wszelkich obliczeń prawdopodobieństwa dotyczących oczekiwanych ruchów cen na rynku akcji dla akcji i indeksów. Są one używane w handlu opartym na zakresie, identyfikującym trend wzrostowy lub trend spadkowy, poziomy wsparcia lub oporu oraz inne wskaźniki techniczne oparte na normalnych koncepcjach rozkładu średniej i odchylenia standardowego.
Porównaj rachunki inwestycyjne × Oferty przedstawione w tej tabeli pochodzą od spółek, od których Investopedia otrzymuje wynagrodzenie. Nazwa dostawcy OpisPowiązane artykuły
Handel podstawową edukacją
Testowanie hipotez w finansach: koncepcja i przykłady
Zarządzanie ryzykiem
Zoptymalizuj swoje portfolio przy użyciu normalnej dystrybucji
Analiza techniczna Edukacja podstawowa
Liniowa regresja czasu i ceny
Zarządzanie ryzykiem
Zastosowania i granice zmienności
Analiza finansowa
Jak obliczyć wartość zagrożoną (VaR) w programie Excel
Narzędzia do analizy fundamentalnej
Zrozumienie pomiarów zmienności
Linki partnerskieTerminy pokrewne
Definicja przedziału ufności Przedział ufności w statystykach odnosi się do prawdopodobieństwa, że parametr populacji spadnie między dwiema ustawionymi wartościami. więcej Zarządzanie ryzykiem w finansach Zarządzanie ryzykiem w świecie finansów to proces identyfikacji, analizy i akceptacji lub łagodzenia niepewności w decyzjach inwestycyjnych. Zarządzanie ryzykiem odbywa się za każdym razem, gdy inwestor lub zarządzający funduszem analizuje i próbuje oszacować potencjalne straty w inwestycji. więcej Zrozumienie krzywej skarbowej stopy kasowej Krzywą skarbową stopy kasowej definiuje się jako krzywą dochodowości skonstruowaną przy użyciu stóp kasowych raczej niż rentowności. Krzywą skarbową stopy spot można wykorzystać jako punkt odniesienia dla wyceny obligacji. więcej Definicja indeksu Gini Indeks Giniego jest statystyczną miarą rozkładu, często stosowaną jako miernik nierówności ekonomicznej. więcej Model wyceny aktywów kapitałowych (CAPM) Model wyceny aktywów kapitałowych to model opisujący związek między ryzykiem a oczekiwanym zwrotem. więcej Zrozumienie średniej harmonicznej Średnia harmoniczna jest średnią stosowaną w finansach do średnich wielokrotności, takich jak stosunek ceny do zysków. więcej