Co to jest kwartyl?
Kwartyl to termin statystyczny opisujący podział obserwacji na cztery określone przedziały w oparciu o wartości danych i ich porównanie z całym zestawem obserwacji.
Zrozumienie kwartyli
Aby zrozumieć kwartyl, ważne jest, aby zrozumieć medianę jako miarę tendencji centralnej. Mediana w statystyce jest środkową wartością zestawu liczb. Jest to punkt, w którym dokładnie połowa danych znajduje się poniżej i powyżej wartości centralnej.
Tak więc, biorąc pod uwagę zestaw 13 liczb, mediana byłaby siódmą liczbą. Sześć liczb poprzedzających tę wartość to najniższe liczby w danych, a sześć liczb po medianie to najwyższe liczby w podanym zestawie danych. Ponieważ na medianę nie mają wpływu skrajne wartości lub wartości odstające w rozkładzie, czasami jest ona preferowana w stosunku do średniej.
Mediana jest niezawodnym estymatorem lokalizacji, ale nie mówi nic o tym, jak dane po obu stronach ich wartości są rozkładane lub rozproszone. W tym miejscu wkracza kwartyl. Kwartyl mierzy rozkład wartości powyżej i poniżej średniej, dzieląc rozkład na cztery grupy.
Kluczowe dania na wynos
- Kwartyl mierzy rozkład wartości powyżej i poniżej średniej, dzieląc rozkład na cztery grupy. Kwartyl dzieli dane na trzy punkty - dolny kwartał, mediana i górny kwartyl - w celu utworzenia czterech grup zbioru danych. obliczyć zakres międzykwartylowy, który jest miarą zmienności wokół mediany.
Jak działają kwartyle
Podobnie jak mediana dzieli dane na pół, tak że 50% pomiaru leży poniżej mediany, a 50% leży powyżej niej, kwartyl dzieli dane na ćwiartki, tak że 25% pomiaru jest mniejsze niż dolny kwartyl, 50 % to mniej niż średnia, a 75% to mniej niż górny kwartyl.
Kwartyl dzieli dane na trzy punkty - dolny kwartał, mediana i górny kwartyl - w celu utworzenia czterech grup zbioru danych. Niższy kwartyl lub pierwszy kwartyl jest oznaczony jako Q1 i jest środkową liczbą, która mieści się między najmniejszą wartością zestawu danych a medianą. Drugi kwartyl, Q2, jest również medianą. Górny lub trzeci kwartyl, oznaczony jako Q3, jest centralnym punktem leżącym między medianą a najwyższą liczbą rozkładu.
Teraz możemy zmapować cztery grupy utworzone z kwartyli. Pierwsza grupa wartości zawiera najmniejszą liczbę do Q1; druga grupa obejmuje Q1 do mediany; trzeci zestaw jest medianą do Q3; czwarta kategoria obejmuje Q3 do najwyższego punktu danych w całym zestawie.
Każdy kwartyl zawiera 25% wszystkich obserwacji. Ogólnie dane są uporządkowane od najmniejszej do największej:
- Pierwszy kwartyl: najniższe 25% liczb Drugi kwartyl: od 25, 1% do 50% (do mediany) Trzeci kwartyl: 51% do 75% (powyżej mediany) Czwarty kwartyl: najwyższe 25% liczb
Przykład kwartylu
Pracujmy z przykładem. Załóżmy, że rozkład wyników matematycznych w klasie 19 uczniów w porządku rosnącym jest następujący:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Najpierw zaznacz medianę Q2, która w tym przypadku jest dziesiątą wartością: 75.
Q1 jest centralnym punktem między najmniejszym wynikiem a medianą. W tym przypadku Q1 mieści się między pierwszym a piątym wynikiem: 68..
Q3 to średnia wartość pomiędzy Q2 a najwyższym wynikiem: 84..
Teraz, gdy mamy nasze kwartyle, zinterpretujmy ich liczby. Wynik 68 (Q1) reprezentuje pierwszy kwartyl i jest 25. percentylem. 68 to mediana dolnej połowy wyniku uzyskanego w dostępnych danych, tj. Mediana wyników od 59 do 75.
Q1 mówi nam, że 25% wyników to mniej niż 68, a 75% wyników w klasie jest większa. Q2 (mediana) jest 50. percentylem i pokazuje, że 50% wyników jest mniejszych niż 75, a 50% wyników jest powyżej 75. Wreszcie, 3. kwarta, 75. percentyl, ujawnia, że 25% wyników to większy, a 75% to mniej niż 84.
Uwagi specjalne
Jeśli punkt danych dla Q1 znajduje się dalej od mediany niż Q3 od mediany, możemy powiedzieć, że istnieje większe rozproszenie między mniejszymi wartościami zestawu danych niż między większymi wartościami. Ta sama logika obowiązuje, jeśli Q3 jest dalej od Q2 niż Q1 od mediany.
Alternatywnie, jeśli istnieje parzysta liczba punktów danych, mediana będzie średnią z dwóch środkowych liczb. W powyższym przykładzie, gdybyśmy mieli 20 uczniów zamiast 19, mediana ich wyników będzie średnią arytmetyczną dziesiątej i jedenastej liczby.
Kwartyle służą do obliczania zakresu międzykwartylowego, który jest miarą zmienności wokół mediany. Przedział międzykwartylowy oblicza się po prostu jako różnicę między pierwszym i trzecim kwartylem: Q3 - Q1. W efekcie zakres środkowej połowy danych pokazuje rozkład danych.
W przypadku dużych zestawów danych program Microsoft Excel ma funkcję KWARTYLU do obliczania kwartylów.
