Spis treści
- Co to jest test T?
- Wyjaśnienie testu T
- Niejednoznaczne wyniki testu
- Założenia testu T
- Obliczanie testów T
- Skorelowany (lub sparowany) test T
- Test T równej wariancji (połączonej)
- Nierówny test T wariancji
- Określanie, którego testu T użyć
- Nierówny wariant testu t wariancji
Co to jest test T?
Test t jest rodzajem wnioskowania statystycznego stosowanym do ustalenia, czy istnieje znacząca różnica między średnimi dwóch grup, która może być powiązana w niektórych cechach. Najczęściej stosuje się go, gdy zbiory danych, takie jak zbiór danych zarejestrowany jako wynik rzutu monetą 100 razy, będą miały normalny rozkład i mogą mieć nieznane wariancje. Test t służy jako narzędzie do testowania hipotez, które umożliwia testowanie założenia mającego zastosowanie do populacji.
Test t sprawdza statystykę t, wartości rozkładu t i stopnie swobody w celu ustalenia prawdopodobieństwa różnicy między dwoma zestawami danych. Aby przeprowadzić test z trzema lub więcej zmiennymi, należy zastosować analizę wariancji.
Test T
Wyjaśnienie testu T
Zasadniczo test t pozwala nam porównać średnie wartości dwóch zestawów danych i ustalić, czy pochodzą one z tej samej populacji. W powyższych przykładach, gdybyśmy mieli pobrać próbkę uczniów z klasy A i kolejną próbkę uczniów z klasy B, nie spodziewalibyśmy się, że będą mieli dokładnie taką samą średnią i odchylenie standardowe. Podobnie próbki pobrane z grupy kontrolnej karmionej placebo i próbki pobrane z grupy przepisanej lekiem powinny mieć nieco inną średnią i odchylenie standardowe.
Matematycznie test t pobiera próbkę z każdego z dwóch zestawów i ustala stwierdzenie problemu, przyjmując hipotezę zerową, że dwa średnie są równe. W oparciu o obowiązujące formuły pewne wartości są obliczane i porównywane z wartościami standardowymi, a przyjęta hipoteza zerowa jest odpowiednio przyjmowana lub odrzucana.
Jeśli hipoteza zerowa kwalifikuje się do odrzucenia, oznacza to, że odczyty danych są silne i nie są przypadkowe. Test t jest tylko jednym z wielu testów zastosowanych w tym celu. Statystycy muszą dodatkowo zastosować testy inne niż test t, aby zbadać więcej zmiennych i testy z większą wielkością próby. W przypadku dużej wielkości próby statystycy stosują test Z. Inne opcje testowania obejmują test chi-kwadrat i test F.
Istnieją trzy rodzaje testów t i są one klasyfikowane jako zależne i niezależne testy t.
Kluczowe dania na wynos
- Test t jest rodzajem wnioskowania statystycznego stosowanym do ustalenia, czy istnieje znacząca różnica między średnimi dwóch grup, które mogą być powiązane w niektórych cechach. Test t jest jednym z wielu testów stosowanych do testowania hipotez w statystyce Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwaną średnią różnicą), odchyleniem standardowym każdej grupy i liczbą wartości danych każdej grupy. Istnieje kilka różnych rodzajów testu t, który można wykonać w zależności od na wymagane dane i rodzaj analizy.
Niejednoznaczne wyniki testu
Weź pod uwagę, że producent leków chce przetestować nowo wynaleziony lek. Postępuje zgodnie ze standardową procedurą wypróbowania leku na jednej grupie pacjentów i przekazania placebo innej grupie, zwanej grupą kontrolną. Placebo podane grupie kontrolnej jest substancją bez zamierzonej wartości terapeutycznej i służy jako punkt odniesienia do pomiaru reakcji drugiej grupy, której podano rzeczywisty lek.
Po próbie narkotykowej członkowie grupy kontrolnej karmionej placebo zgłosili wzrost średniej długości życia o trzy lata, a członkowie grupy, której przepisano nowy lek, zgłosili wzrost średniej długości życia o cztery lata. Natychmiastowa obserwacja może wskazywać, że lek rzeczywiście działa, ponieważ wyniki są lepsze dla grupy stosującej lek. Jednak możliwe jest również, że obserwacja może być spowodowana przypadkowym wystąpieniem, szczególnie zaskakującym szczęściem. Test t jest przydatny do stwierdzenia, czy wyniki są rzeczywiście poprawne i mają zastosowanie do całej populacji.
W szkole 100 uczniów w klasie A uzyskało średnio 85% przy standardowym odchyleniu 3%. Kolejnych 100 uczniów należących do klasy B uzyskało średnią 87% przy standardowym odchyleniu 4%. Chociaż średnia w klasie B jest lepsza niż w klasie A, może nie być poprawne wyciągnięcie wniosku, że ogólna wydajność uczniów w klasie B jest lepsza niż uczniów w klasie A. Jest tak, ponieważ wraz z oznacza to, że odchylenie standardowe dla klasy B jest również wyższe niż dla klasy A. Wskazuje to, że ich skrajne wartości procentowe, po stronie dolnej i wyższej, były znacznie bardziej rozłożone w porównaniu do wartości klasy A. Test t może pomóc w ustaleniu która klasa wypadła lepiej.
Założenia testu T
- Pierwsze założenie dotyczące testów t dotyczy skali pomiaru. W teście t przyjęto, że skala pomiaru zastosowana do zebranych danych jest zgodna ze skalą ciągłą lub porządkową, taką jak wyniki testu IQ. Drugim założeniem jest prosta próbka losowa, że dane są zebrane z reprezentatywnej, losowo wybranej części całkowitej populacji. Trzecie założenie to dane, kiedy wykreślone, daje rozkład normalny, krzywą rozkładu w kształcie dzwonu. Czwarte założenie jest dość dużym rozmiarem próby. Większy rozmiar próbki oznacza, że rozkład wyników powinien zbliżać się do normalnej krzywej w kształcie dzwonu. Ostatnim założeniem jest jednorodność wariancji. Homogeniczna lub równa wariancja występuje, gdy standardowe odchylenia próbek są w przybliżeniu równe.
Obliczanie testów T
Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwaną średnią różnicą), odchylenie standardowe każdej grupy oraz liczbę wartości danych każdej grupy.
Wynik testu t daje wartość t. Ta obliczona wartość t jest następnie porównywana z wartością uzyskaną z tabeli wartości krytycznych (zwanej tabelą rozkładu T). To porównanie pomaga ustalić, jak prawdopodobne jest, że różnica między średnimi wystąpiła przypadkowo, lub czy zbiory danych rzeczywiście mają wewnętrzne różnice. Test t pyta, czy różnica między grupami reprezentuje prawdziwą różnicę w badaniu, czy też jest to prawdopodobnie bezsensowna różnica statystyczna.
Tabele rozkładu T.
Tabela rozkładów T jest dostępna w formatach jednoogonowych i dwuogonowych. Pierwszy służy do oceny przypadków, które mają stałą wartość lub zakres z wyraźnym kierunkiem (dodatnim lub ujemnym). Na przykład, jakie jest prawdopodobieństwo, że wartość wyjściowa pozostanie poniżej -3 lub uzyska więcej niż siedem, gdy rzucisz parę kości? Ten ostatni jest wykorzystywany do analizy związanej z zakresem, na przykład do pytania, czy współrzędne mieszczą się w zakresie od -2 do +2.
Obliczenia można wykonać za pomocą standardowych programów obsługujących niezbędne funkcje statystyczne, takie jak te znalezione w MS Excel.
Wartości T i stopnie swobody
Test t daje jako wynik dwie wartości: wartość t i stopnie swobody. Wartość t jest stosunkiem różnicy między średnią dwóch zestawów próbek a różnicą występującą w zestawach próbek. Podczas gdy wartość licznika (różnica między średnią dwóch zestawów próbek) jest łatwa do obliczenia, mianownik (różnica występująca w zestawach próbek) może stać się nieco skomplikowany w zależności od rodzaju wartości danych. Mianownik stosunku jest miarą dyspersji lub zmienności. Wyższe wartości wartości t, zwane również wynikiem t, wskazują, że istnieje duża różnica między dwoma zestawami próbek. Im mniejsza wartość t, tym większe podobieństwo między dwoma zestawami próbek.
- Duży wynik t wskazuje, że grupy są różne. Mały wynik t wskazuje, że grupy są podobne.
Stopnie swobody odnoszą się do wartości w badaniu, które mogą się zmieniać i są niezbędne do oceny ważności i ważności hipotezy zerowej. Obliczenie tych wartości zwykle zależy od liczby rekordów danych dostępnych w zestawie próbek.
Skorelowany (lub sparowany) test T
Skorelowany test t wykonuje się, gdy próbki zazwyczaj składają się z dopasowanych par podobnych jednostek lub gdy występują przypadki powtarzanych pomiarów. Na przykład mogą wystąpić przypadki wielokrotnego testowania tych samych pacjentów - przed i po otrzymaniu określonego leczenia. W takich przypadkach każdego pacjenta używa się jako próbki kontrolnej przeciwko sobie.
Ta metoda ma również zastosowanie w przypadkach, w których próbki są w jakiś sposób powiązane lub mają pasujące cechy, takie jak analiza porównawcza z udziałem dzieci, rodziców lub rodzeństwa. Skorelowane lub sparowane testy t są typu zależnego, ponieważ dotyczą one przypadków, w których dwa zestawy próbek są powiązane.
Wzór na obliczenie wartości t i stopni swobody dla sparowanego testu t to:
- Mean1 i mean2 są średnimi wartościami każdego zestawu próbek, podczas gdy var1 i var2 reprezentują wariancję każdego zestawu próbek.
Pozostałe dwa typy należą do niezależnych testów t. Próbki tego typu są wybierane niezależnie od siebie - to znaczy zestawy danych w dwóch grupach nie odnoszą się do tych samych wartości. Obejmują przypadki takie jak grupa 100 pacjentów podzielona na dwa zestawy po 50 pacjentów. Jedna z grup staje się grupą kontrolną i otrzymuje placebo, podczas gdy druga grupa otrzymuje przepisane leczenie. Stanowi to dwie niezależne grupy próbek, które są niesparowane ze sobą.
Test T równej wariancji (lub łącznej)
Test t równej wariancji stosuje się, gdy liczba próbek w każdej grupie jest taka sama lub wariancja dwóch zestawów danych jest podobna. Poniższy wzór stosuje się do obliczenia wartości t i stopni swobody dla testu t równej wariancji:
W pobliżu Wartość T = n1 + n2-2 (n1-1) × var12 + (n2−1) × var22 × n11 + n21 średnia1-średnia2 gdzie: średnia1 i średnia2 = średnie wartości każdej z próbek zestawów i var2 = wariancja każdego z zestawów próbek n1 i n2 = liczba rekordów w każdym zestawie próbek
i, W pobliżu Stopnie swobody = n1 + n2-2 gdzie: n1 i n2 = Liczba rekordów w każdym zestawie próbek
Nierówny test T wariancji
Nierówny test t wariancji stosuje się, gdy liczba próbek w każdej grupie jest inna, a wariancja dwóch zestawów danych jest również inna. Ten test nazywa się również testem t-Welcha. Poniższy wzór stosuje się do obliczenia wartości t i stopni swobody dla testu t nierównej wariancji:
W pobliżu Wartość T = n1var12 + n2var22 średnia1 - średnia2 gdzie: średnia1 i średnia2 = średnie wartości każdego zestawu próbek var1 i var2 = wariancja każdego zestawu próbek n1 i n2 = liczba rekordów w każdym zestawie próbek
i, W pobliżu Stopnie swobody = n1-1 (n1var12) 2 + n2-1 (n2var22) 2 (n1var12 + n2var22) 2 gdzie: var1 i var2 = wariancja każdego z zestawów próbek n1 i n2 = liczba rekordów w każdym zestawie próbek
Określanie właściwego testu T do użycia
Poniższy schemat blokowy można wykorzystać do ustalenia, który test t należy zastosować w oparciu o cechy charakterystyczne zestawów próbek. Kluczowe elementy, które należy wziąć pod uwagę, obejmują to, czy rekordy próbki są podobne, liczbę rekordów danych w każdym zestawie próbek oraz wariancję każdego zestawu próbek.
Zdjęcie Julie Bang © Investopedia 2019
Nierówny wariant testu t wariancji
Załóżmy, że wykonujemy pomiar po przekątnej obrazów otrzymanych w galerii sztuki. Jedna grupa próbek zawiera 10 obrazów, a druga zawiera 20 obrazów. Zestawy danych, z odpowiednimi wartościami średnimi i wariancjami, są następujące:
Zestaw 1 | Zestaw 2 | |
19, 7 | 28, 3 | |
20.4 | 26, 7 | |
19, 6 | 20.1 | |
17, 8 | 23, 3 | |
18, 5 | 25, 2 | |
18, 9 | 22.1 | |
18, 3 | 17.7 | |
18, 9 | 27, 6 | |
19, 5 | 20, 6 | |
21, 95 | 13, 7 | |
23, 2 | ||
17.5 | ||
20, 6 | ||
18 | ||
23, 9 | ||
21, 6 | ||
24, 3 | ||
20.4 | ||
23, 9 | ||
13, 3 | ||
Oznaczać | 19, 4 | 21, 6 |
Zmienność | 1.4 | 17.1 |
Chociaż średnia dla zestawu 2 jest wyższa niż dla zestawu 1, nie możemy stwierdzić, że wszystkie obrazy mają średnią długość około 21, 6 jednostek, ponieważ wariancja zestawu 2 jest znacznie wyższa niż zestawu 1. Czy to przez przypadek, czy naprawdę istnieją różnice w ogólnej populacji wszystkich obrazów otrzymanych w galerii sztuki? Problem ustalamy, zakładając hipotezę zerową, że średnia jest taka sama między dwoma zestawami próbek i przeprowadzamy test t, aby potwierdzić, czy hipoteza jest prawdziwa.
Ponieważ liczba rekordów danych jest różna (n1 = 10 i n2 = 20), a wariancja jest również inna, wartość t i stopnie swobody są obliczane dla powyższego zestawu danych przy użyciu wzoru wymienionego w teście nierównej wariancji T Sekcja.
Wartość t wynosi -2.24787. Ponieważ znak minus można zignorować podczas porównywania dwóch wartości t, obliczona wartość wynosi 2, 24787.
Wartość stopni swobody wynosi 24, 38 i jest zmniejszona do 24, ze względu na definicję formuły wymagającą zaokrąglenia w dół wartości do najmniejszej możliwej wartości całkowitej.
Ilekroć zakłada się rozkład normalny, jako kryterium akceptacji można określić poziom prawdopodobieństwa (poziom alfa, poziom istotności, p ). W większości przypadków można przyjąć wartość 5%.
Wykorzystując wartość stopnia swobody jako 24 i 5% poziom istotności, spojrzenie na tabelę rozkładu wartości t daje wartość 2, 064. Porównanie tej wartości z wartością obliczoną 2, 247 wskazuje, że obliczona wartość t jest większa niż wartość z tabeli na poziomie istotności 5%. Dlatego można bezpiecznie odrzucić hipotezę zerową, że nie ma różnicy między średnimi. Zestaw populacji ma wewnętrzne różnice i nie są przypadkowe.
Porównaj rachunki inwestycyjne × Oferty przedstawione w tej tabeli pochodzą od spółek, od których Investopedia otrzymuje wynagrodzenie. Nazwa dostawcy OpisTerminy pokrewne
Jak działa analiza wariancji (ANOVA) Analiza wariancji (ANOVA) to narzędzie analizy statystycznej, które dzieli całkowitą zmienność stwierdzoną w zbiorze danych na dwa składniki: czynniki losowe i systematyczne. więcej Definicja testu Z Test Z jest testem statystycznym stosowanym do ustalenia, czy dwie średnie populacji są różne, gdy znane są wariancje i wielkość próby jest duża. więcej Stopnie swobody Definicja Stopnie swobody odnosi się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które mogą się zmieniać w próbce danych. więcej Zrozumienie rozkładu T Rozkład AT jest rodzajem funkcji prawdopodobieństwa, która jest odpowiednia do szacowania parametrów populacji dla małych wielkości próby lub nieznanych wariancji. więcej Co mierzy pół-odchylenie Pół-odchylenie to metoda oceny poniżej średnich wahań zwrotu z inwestycji. Jest stosowany jako alternatywa dla odchylenia standardowego. więcej Test Bonferroniego Test Bonferroniego jest rodzajem testu wielokrotnego porównania stosowanego w analizie statystycznej. więcej linków partnerskichPowiązane artykuły
Ekonomia
Jakie założenia przyjmuje się podczas przeprowadzania testu t?
Zarządzanie ryzykiem
Wykorzystanie historycznej zmienności do oceny przyszłego ryzyka
Strategia obrotu akcjami i edukacja
Jak używać programu Excel do symulacji cen akcji
Wskaźniki finansowe
Jak obliczyć IRR w Excelu?
Matematyka i statystyka
Co to jest względny błąd standardowy
Wskaźniki finansowe
Jaki jest wzór na obliczanie wartości bieżącej netto (NPV) w programie Excel?
