Co to jest analiza wariancji (ANOVA)?
Analiza wariancji (ANOVA) to narzędzie analityczne stosowane w statystyce, które dzieli obserwowaną zmienność agregowaną znalezioną w zbiorze danych na dwie części: czynniki systematyczne i czynniki losowe. Czynniki systematyczne mają statystyczny wpływ na dany zestaw danych, podczas gdy czynniki losowe nie. Analitycy wykorzystują test ANOVA do określenia wpływu zmiennych niezależnych na zmienną zależną w badaniu regresji.
Metody testu ti z opracowane w XX wieku były wykorzystywane do analizy statystycznej do 1918 roku, kiedy Ronald Fisher stworzył metodę analizy wariancji. ANOVA jest również nazywana analizą wariancji Fishera i stanowi rozszerzenie testów ti z. Termin ten stał się znany w 1925 r., Po ukazaniu się w książce Fishera „Metody statystyczne dla pracowników naukowych”. Został zastosowany w psychologii eksperymentalnej, a później rozszerzył się na tematy bardziej złożone.
Wzór na ANOVA to:
W pobliżu F = MSEMST gdzie: F = współczynnik ANOVA MST = średnia suma kwadratów z powodu leczenia MSE = średnia suma kwadratów z powodu błędu
Co ujawnia analiza wariancji?
Test ANOVA jest początkowym etapem analizy czynników wpływających na dany zestaw danych. Po zakończeniu testu analityk przeprowadza dodatkowe badanie czynników metodycznych, które w wymierny sposób przyczyniają się do niespójności zestawu danych. Analityk wykorzystuje wyniki testu ANOVA w teście f do wygenerowania dodatkowych danych, które są zgodne z proponowanymi modelami regresji.
Test ANOVA pozwala na porównanie więcej niż dwóch grup jednocześnie, aby ustalić, czy istnieje między nimi związek. Wynik formuły ANOVA, statystyki F (zwanej również współczynnikiem F), pozwala na analizę wielu grup danych w celu określenia zmienności między próbkami i wewnątrz próbek.
Jeśli nie ma rzeczywistej różnicy między badanymi grupami, co nazywa się hipotezą zerową, wynik statystyki współczynnika F ANOVA będzie zbliżony do 1. Wahania w jego próbkowaniu prawdopodobnie będą zgodne z rozkładem F F. W rzeczywistości jest to grupa funkcji rozkładu o dwóch charakterystycznych liczbach, zwanych licznikowymi stopniami swobody i mianownikiem stopni swobody.
Kluczowe dania na wynos
- Analiza wariancji lub ANOVA jest metodą statystyczną, która dzieli obserwowane dane wariancji na różne komponenty do wykorzystania w dodatkowych testach. Jednokierunkowa ANOVA jest używana dla trzech lub więcej grup danych, w celu uzyskania informacji o związku między zależną a zależną zmienne niezależne. Jeśli nie ma prawdziwej wariancji między grupami, współczynnik F ANOVA powinien wynosić blisko 1.
Przykład użycia ANOVA
Badacz może na przykład przetestować uczniów z wielu szkół wyższych, aby sprawdzić, czy uczniowie z jednej ze szkół stale przewyższają uczniów z innych szkół wyższych. W aplikacji biznesowej badacz R&D może przetestować dwa różne procesy tworzenia produktu, aby sprawdzić, czy jeden proces jest lepszy od drugiego pod względem efektywności kosztowej.
Rodzaj zastosowanego testu ANOVA zależy od wielu czynników. Jest stosowany, gdy dane muszą być eksperymentalne. Analiza wariancji jest stosowana, jeśli nie ma dostępu do oprogramowania statystycznego, co powoduje ręczne obliczenie ANOVA. Jest prosty w użyciu i najlepiej nadaje się do małych próbek. Przy wielu projektach eksperymentalnych rozmiary próbek muszą być takie same dla różnych kombinacji poziomów czynników.
ANOVA pomaga w testowaniu trzech lub więcej zmiennych. Jest podobny do wielu testów t dwóch próbek. Jednak powoduje mniej błędów typu I i jest odpowiedni do szeregu problemów. ANOVA grupuje różnice poprzez porównanie średnich dla każdej grupy i obejmuje rozłożenie wariancji na różne źródła. Stosuje się go u badanych, grup testowych, między grupami i wewnątrz grup.
ANOVA jednokierunkowa a ANOVA dwukierunkowa
Istnieją dwa typy ANOVA: jednokierunkowe (lub jednokierunkowe) i dwukierunkowe. Jednokierunkowy lub dwukierunkowy odnosi się do liczby niezależnych zmiennych w analizie testu wariancji. Jednokierunkowa ANOVA ocenia wpływ jedynego czynnika na jedyną zmienną odpowiedzi. Określa, czy wszystkie próbki są takie same. Jednokierunkowa ANOVA służy do ustalenia, czy istnieją jakieś statystycznie istotne różnice między średnimi trzech lub więcej niezależnych (niepowiązanych) grup.
Dwukierunkowa ANOVA jest rozszerzeniem jednokierunkowej ANOVA. W jedną stronę masz jedną niezależną zmienną wpływającą na zmienną zależną. Dzięki dwukierunkowej ANOVA istnieją dwa niezależne. Na przykład dwukierunkowa ANOVA umożliwia firmie porównanie wydajności pracowników na podstawie dwóch niezależnych zmiennych, takich jak wynagrodzenie i zestaw umiejętności. Służy do obserwowania interakcji między dwoma czynnikami i testowania wpływu dwóch czynników jednocześnie.
