Co to jest reguła empiryczna?
Reguła empiryczna, zwana także regułą trzech sigma lub regułą 68–95–99, 7, jest regułą statystyczną, która stwierdza, że dla rozkładu normalnego prawie wszystkie dane mieszczą się w trzech standardowych odchyleniach (oznaczonych przez σ) średniej (oznaczony przez µ). W podziale reguła empiryczna pokazuje, że 68% mieści się w pierwszym odchyleniu standardowym (µ ± σ), 95% w pierwszych dwóch odchyleniach standardowych (µ ± 2σ) i 99, 7% w pierwszych trzech odchyleniach standardowych (µ ± 3σ).
Zasada empiryczna
Zrozumienie zasady empirycznej
Reguła empiryczna jest często stosowana w statystykach do prognozowania ostatecznych wyników. Po obliczeniu odchylenia standardowego i przed zebraniem dokładnych danych, reguła ta może być wykorzystana jako przybliżony szacunek wyniku zbliżających się danych. Prawdopodobieństwo to można wykorzystać tymczasowo, ponieważ gromadzenie odpowiednich danych może być czasochłonne lub nawet niemożliwe. Reguła empiryczna jest również używana jako szorstki sposób na przetestowanie „normalności” rozkładu. Jeśli zbyt wiele punktów danych wykracza poza trzy granice odchylenia standardowego, sugeruje to, że rozkład nie jest normalny.
Kluczowe dania na wynos
- Reguła empiryczna stwierdza, że prawie wszystkie dane mieszczą się w granicach 3 odchyleń standardowych od średniej dla rozkładu normalnego. Zgodnie z tą zasadą 68% danych mieści się w jednym odchyleniu standardowym. 95% danych mieści się w granicach dwóch odchyleń standardowych. trzy odchylenia standardowe stanowią 99, 7% danych.
Przykłady reguły empirycznej
Załóżmy, że populacja zwierząt w zoo jest znana z normalnej dystrybucji. Każde zwierzę żyje średnio 13, 1 lat (średnia), a standardowe odchylenie długości życia wynosi 1, 5 roku. Jeśli ktoś chce wiedzieć, że zwierzę będzie żyło dłużej niż 14, 6 lat, może zastosować zasadę empiryczną. Znając średnią rozkładu w wieku 13, 1 lat, dla każdego odchylenia standardowego występują następujące przedziały wiekowe:
- Jedno odchylenie standardowe (µ ± σ): (13, 1 - 1, 5) do (13, 1 + 1, 5) lub 11, 6 do 14, 6 Dwa odchylenia standardowe (µ ± 2σ): 13, 1 - (2 x 1, 5) do 13, 1 + (2 x 1, 5), lub 10, 1 do 16, 1 Trzy odchylenia standardowe (µ ± 3σ): 13, 1 - (3 x 1, 5) do 13, 1 + (3 x 1, 5) lub, 8, 6 do 17, 6
Osoba rozwiązująca ten problem musi obliczyć całkowite prawdopodobieństwo życia zwierzęcia w wieku 14, 6 lat lub dłużej. Reguła empiryczna pokazuje, że 68% rozkładu mieści się w obrębie jednego odchylenia standardowego, w tym przypadku od 11, 6 do 14, 6 lat. Zatem pozostałe 32% rozkładu leży poza tym zakresem. Połowa leży powyżej 14, 6, a połowa poniżej 11, 6. Prawdopodobieństwo przeżycia zwierzęcia przez więcej niż 14, 6 wynosi 16% (liczone jako 32% podzielone przez dwa).
Jako kolejny przykład załóżmy, że zwierzę w zoo żyje średnio do 10 lat, przy standardowym odchyleniu 1, 4 roku. Załóżmy, że dozorca próbuje ustalić prawdopodobieństwo życia zwierzęcia przez ponad 7, 2 lat. Ta dystrybucja wygląda następująco:
- Jedno odchylenie standardowe (µ ± σ): 8, 6 do 11, 4 lat Dwa odchylenia standardowe (µ ± 2σ): 7, 2 do 12, 8 lat Trzy odchylenia standardowe ((µ ± 3σ): 5, 8 do 14, 2 lat
Reguła empiryczna stwierdza, że 95% rozkładu mieści się w dwóch standardowych odchyleniach. Zatem 5% leży poza dwoma standardowymi odchyleniami; połowa powyżej 12, 8 roku i połowa poniżej 7, 2 roku. Zatem prawdopodobieństwo życia przez ponad 7, 2 lat wynosi:
95% + (5% / 2) = 97, 5%
