Jakie są stopnie wolności?
Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które można dowolnie zmieniać, w próbce danych.
Kluczowe dania na wynos
- Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które mogą się zmieniać w próbce danych. Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystykach, takich jak Chi- Kwadrat. Obliczanie stopni swobody ma kluczowe znaczenie przy próbie zrozumienia znaczenia statystyki chi-kwadrat i ważności hipotezy zerowej.
Zrozumienie stopni wolności
Najłatwiejszym sposobem zrozumienia koncepcyjnego stopni wolności jest przykład:
- Rozważ próbkę danych składającą się dla uproszczenia z pięciu liczb całkowitych dodatnich. Wartości mogą być dowolnymi liczbami bez znanego związku między nimi. Ta próbka danych miałaby teoretycznie pięć stopni swobody. Cztery liczby w próbce wynoszą {3, 8, 5 i 4}, a średnia z całej próbki danych wynosi 6, co musi oznaczać, że piąta liczba musi wynosić 10. Nie może to być nic więcej. Nie ma swobody zmiany, więc stopień swobody dla tej próbki danych wynosi 4.
Wzór na stopnie swobody równa się wielkości próbki danych minus jeden:
W pobliżu Df = N − 1 gdzie: Df = stopnie swobody N = wielkość próbki
Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystykach, takich jak chi-kwadrat. Konieczne jest obliczenie stopni swobody przy próbie zrozumienia znaczenia statystyki chi-kwadrat i ważności hipotezy zerowej.
Testy chi-kwadrat
Istnieją dwa rodzaje testów Chi-Square: test niezależności, który zadaje pytanie o związek, na przykład: „Czy istnieje związek między wynikami płci i SAT?”; oraz test dobroci dopasowania, który brzmi: „Jeśli moneta zostanie rzucona 100 razy, to czy podniesie głowę 50 razy, a reszka 50 razy?”
W tych testach wykorzystuje się stopnie swobody, aby ustalić, czy określoną hipotezę zerową można odrzucić na podstawie całkowitej liczby zmiennych i próbek w ramach eksperymentu. Na przykład, biorąc pod uwagę studentów i wybór kursu, wielkość próbki 30 lub 40 studentów prawdopodobnie nie jest wystarczająco duża, aby wygenerować znaczące dane. Uzyskiwanie takich samych lub podobnych wyników z badania na próbie liczącej 400 lub 500 studentów jest bardziej uzasadnione.
Historia stopni wolności
Najwcześniejsza i najbardziej podstawowa koncepcja stopni wolności została odnotowana na początku XIX wieku, spleciona z pracami matematyka i astronoma Carla Friedricha Gaussa. Współczesne użycie i zrozumienie tego terminu zostało wyjaśnione po raz pierwszy przez Williama Sealy'ego Gosseta, angielskiego statystę, w jego artykule „Prawdopodobny błąd środka” opublikowanym w Biometrice w 1908 roku pod pseudonimem, aby zachować jego anonimowość.
W swoich pismach Gosset nie posługiwał się terminem „stopnie wolności”. Podał jednak wyjaśnienie tej koncepcji w trakcie opracowywania czegoś, co ostatecznie będzie znane jako rozkład T-Studenta. Termin ten stał się popularny dopiero w 1922 roku. Angielski biolog i statystyk Ronald Fisher zaczął używać terminu „stopnie wolności”, kiedy zaczął publikować raporty i dane na temat swojej pracy, opracowując kwadraty chi.
