Co to znaczy winsorized?
Średnia winsorizowana jest metodą uśredniania, która początkowo zastępuje najmniejsze i największe wartości obserwacjami najbliższymi. Odbywa się to w celu ograniczenia wpływu nieprawidłowych wartości ekstremalnych lub wartości odstających na obliczenia. Po zastąpieniu wartości, następnie stosuje się wzór średniej arytmetycznej do obliczenia średniej zinsorizowanej.
Wzór na Winsorized Mean Is
W pobliżu Winsorized Mean = Nxn… xn + 1 + xn + 2… xn gdzie: n = liczba największych i najmniejszych punktów danych, które należy zastąpić obserwacją
Winsorized średnie są wyrażone na dwa sposoby. Średnia z „k n ” oznacza zastąpienie „k” najmniejszych i największych obserwacji, gdzie „k” jest liczbą całkowitą. Średnia zwycięska „X%” obejmuje zastąpienie określonego procentu wartości z obu końców danych.
Jak obliczyć średnią winsorized
Średnia wygrana jest obliczana przez zastąpienie najmniejszych i największych punktów danych, a następnie zsumowanie wszystkich punktów danych i podzielenie sumy przez całkowitą liczbę punktów danych.
Co znaczy Winsorized?
Winsorized średnia jest mniej wrażliwa na wartości odstające, ponieważ może zastąpić je wartościami mniej ekstremalnymi. Oznacza to, że jest mniej podatny na kontury w porównaniu ze średnią. Jeśli jednak rozkład ma ogony tłuszczu, efekt usunięcia najwyższych i najniższych wartości w rozkładzie będzie miał niewielki wpływ z powodu dużej liczby zmienności liczb rozkładu.
Kluczowe dania na wynos
- Metoda uśredniania, która obejmuje zamianę najmniejszych i największych wartości na obserwacje najbliższe im. Mniej wrażliwa na wartości odstające, ponieważ może zastąpić je wartościami mniej ekstremalnymi. W przeciwieństwie do średniej przyciętej, która polega na usunięciu punktów danych - chociaż jest to wynik dwóch wydają się być blisko.
Przykład użycia średniej winsorized
Można obliczyć średnią z zinsory dla następującego zestawu danych: 1, 5, 7, 8, 9, 10, 14. W tym przykładzie zakładamy, że średnia z zinsory jest w pierwszej kolejności, zastępujemy najmniejszą i największą wartość ich najbliższe obserwacje.
Zestaw danych wygląda teraz następująco: 5, 5, 7, 8, 9, 10, 10. Biorąc średnią arytmetyczną nowego zestawu daje średnią winsorized 7, 7 lub (5 + 5 + 7 + 8 + 9 + 10 + 10) podzielone przez 7.
Lub weź pod uwagę 20% średnią wygraną, która bierze górne 10% i dolne 10% i zastępuje je następną najbliższą wartością. Zyskamy następujący zestaw danych: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Dwa najmniejsze i największe punkty danych (10%) zostaną zastąpione ich następną najbliższą wartością. Zatem nowy zestaw danych to: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Winsorized średnia wynosi 33, 9 lub suma danych (678) podzielona przez całkowitą liczbę punktów danych (20).
Różnica między średnią winsorized a średnią przyciętą
Średnia wygrana obejmuje modyfikację punktów danych, podczas gdy średnia przycięta obejmuje usunięcie punktów danych. Często jest tak, że średnia winsorized i średnia obcięta są blisko.
Ograniczenia stosowania średniej winsorized
Jednym z głównych minusów winsorized jest to, że wprowadzają one stronniczość do zbioru danych. To prawda, że po modyfikacji zestaw danych jest mniej tendencyjny niż w przypadku pozostawienia wartości odstających.
Dowiedz się więcej o Winsorized Mean
W celu uzyskania wglądu na temat różnic między kluczowymi obliczeniami średnimi.
