Co to jest test dwustronny?
W statystyce test dwustronny jest metodą, w której obszar krytyczny rozkładu jest dwustronny i sprawdza, czy próbka jest większa niż czy mniejsza niż określony zakres wartości. Jest on stosowany w testowaniu hipotez zerowych i testowaniu pod kątem istotności statystycznej. Jeśli badana próbka mieści się w jednym z krytycznych obszarów, hipoteza alternatywna jest akceptowana zamiast hipotezy zerowej. Test dwustronny bierze swoją nazwę od testowania obszaru pod oboma ogonami rozkładu normalnego, chociaż test można zastosować w innych rozkładach niestandardowych.
Kluczowe dania na wynos
- W statystyce test dwustronny jest metodą, w której obszar krytyczny rozkładu jest dwustronny i sprawdza, czy próbka jest większa lub mniejsza niż określony zakres wartości. Jest stosowany w testowaniu i testowaniu zerowej hipotezy dla istotności statystycznej. Jeśli badana próbka mieści się w jednym z krytycznych obszarów, zamiast hipotezy zerowej przyjmuje się hipotezę alternatywną. Zgodnie z konwencją dwustronne testy służą do określenia istotności na poziomie 5%, co oznacza, że każda strona dystrybucja jest obniżona o 2, 5%.
Należy zwrócić uwagę, czy test statystyczny jest jedno- lub dwustronny, ponieważ ma to duży wpływ na interpretację modelu.
Test dwustronny pod kątem istotności. Investopedia
Jak działa test dwustronny
Podstawową koncepcją statystyki wnioskowania jest testowanie hipotez, które jest uruchamiane w celu ustalenia, czy twierdzenie jest prawdziwe, czy nie, biorąc pod uwagę parametr populacji. Testowanie zaprogramowane w celu wykazania, czy średnia próbki jest znacznie większa i znacznie mniejsza niż średnia populacji, jest określane jako test dwustronny.
Test dwustronny ma na celu zbadanie obu stron określonego zakresu danych wyznaczonego przez związany rozkład prawdopodobieństwa. Rozkład prawdopodobieństwa powinien odzwierciedlać prawdopodobieństwo określonego wyniku w oparciu o z góry określone standardy. Wymaga to ustawienia limitu wyznaczającego najwyższe (lub górne) i najniższe (lub niższe) dopuszczalne wartości zmiennych zawarte w zakresie. Każdy punkt danych, który istnieje powyżej górnej granicy lub poniżej dolnej granicy, jest uważany za poza zakresem akceptacji i w obszarze określanym jako zakres odrzucenia.
Nie ma nieodłącznego standardu w odniesieniu do liczby punktów danych, które muszą istnieć w zakresie akceptacji. W przypadkach, w których wymagana jest precyzja, takich jak przy tworzeniu leków farmaceutycznych, można wprowadzić współczynnik odrzucenia wynoszący 0, 001% lub mniej. W przypadkach, w których precyzja jest mniej istotna, takich jak liczba artykułów spożywczych w torbie produktu, współczynnik odrzucenia wynoszący 5% może być odpowiedni.
Przykład testu dwustronnego
Jako hipotetyczny przykład, wyobraź sobie, że nowy makler giełdowy (XYZ) twierdzi, że jego opłaty maklerskie są niższe niż opłaty Twojego obecnego maklera papierów wartościowych (ABC). Dane dostępne z niezależnej firmy badawczej wskazują, że średnia i odchylenie standardowe wszystkich klientów brokera ABC wynosi odpowiednio 18 i 6 USD.
Pobierana jest próbka 100 klientów ABC, a opłaty maklerskie są obliczane według nowych stawek brokera XYZ. Jeśli średnia próbki wynosi 18, 75 USD, a odchylenie standardowe próbki wynosi 6 USD, czy można wnioskować o różnicy w średnim rachunku za pośrednictwo między ABC a pośrednikiem XYZ?
- H 0: Hipoteza zerowa: średnia = 18 H 1: Alternatywna hipoteza: średnia <> 18 (Właśnie to chcemy udowodnić.) Region odrzucenia: Z <= - Z 2, 5 i Z> = Z 2, 5 (przy założeniu 5% poziomu istotności, podział po 2, 5 z każdej strony). Z = (średnia próbki - średnia) / (std-dev / sqrt (liczba próbek)) = (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25
Ta obliczona wartość Z mieści się w dwóch granicach określonych przez: - Z 2, 5 = -1, 96 i Z 2, 5 = 1, 96.
Stwierdza to, że nie ma wystarczających dowodów, aby wnioskować, że istnieje jakakolwiek różnica między stawkami obecnego brokera i nowego brokera. Alternatywnie wartość p = P (Z <-1, 25) + P (Z> 1, 25) = 2 * 0, 1056 = 0, 2112 = 21, 12%, czyli więcej niż 0, 05 lub 5%, prowadzi do tego samego wniosku.
Specjalne uwagi: losowe pobieranie próbek
Dwustronny test można również zastosować praktycznie podczas niektórych czynności produkcyjnych w firmie, takich jak produkcja i pakowanie cukierków w określonym zakładzie. Jeżeli zakład produkcyjny wyznacza jako cel 50 cukierków na torbę, z dopuszczalnym rozkładem od 45 do 55 cukierków, każda znaleziona torebka o ilości poniżej 45 lub więcej 55 jest uważana za znajdującą się w zakresie odrzucenia
Aby potwierdzić, że mechanizmy pakowania są odpowiednio skalibrowane w celu uzyskania oczekiwanego wyniku, można pobrać losowe próbkowanie w celu potwierdzenia dokładności. Aby mechanizmy pakowania były uważane za dokładne, pożądane jest średnio 50 cukierków na torbę o odpowiednim rozkładzie. Ponadto liczba worków, które mieszczą się w zakresie odrzucenia, musi mieścić się w limicie rozkładu prawdopodobieństwa uznanym za akceptowalny jako poziom błędu.
W przypadku wykrycia niedopuszczalnego wskaźnika odrzucenia lub średniego odchylenia zbyt daleko od pożądanej średniej, konieczne może być dostosowanie urządzenia lub powiązanego wyposażenia w celu skorygowania błędu. Regularne stosowanie dwustronnych metod testowania może pomóc w zapewnieniu, że produkcja utrzyma się w granicach w perspektywie długoterminowej.
Test dwustronny a test jednostronny
Gdy test hipotez jest skonfigurowany w celu wykazania, że średnia próbki byłaby wyższa lub niższa niż średnia populacji, jest to określane jako test jednostronny. Test jednostronny bierze swoją nazwę od testowania obszaru pod jednym z ogonów (boków) rozkładu normalnego. Korzystając z testu jednostronnego, analityk bada możliwość związku w jednym kierunku zainteresowania i całkowicie ignoruje możliwość związku w innym kierunku.
Jeśli badana próbka przypada na jednostronny obszar krytyczny, hipoteza alternatywna zostanie zaakceptowana zamiast hipotezy zerowej. Test jednostronny jest również znany jako hipoteza kierunkowa lub test kierunkowy.