Co to jest przedział ufności?
Przedział ufności w statystykach odnosi się do prawdopodobieństwa, że parametr populacji spadnie między dwiema ustawionymi wartościami przez określony czas. Przedziały ufności mierzą stopień niepewności lub pewności w metodzie pobierania próbek. Przedział ufności może przyjmować dowolną liczbę prawdopodobieństw, przy czym najczęściej jest to poziom ufności 95% lub 99%.
Przedział ufności i poziom ufności są ze sobą powiązane, ale nie są dokładnie takie same.
Zrozumienie przedziału ufności
Statystycy wykorzystują przedziały ufności do pomiaru niepewności. Na przykład badacz wybiera losowo różne próbki z tej samej populacji i oblicza przedział ufności dla każdej próbki. Wynikowe zestawy danych są różne; niektóre przedziały zawierają prawdziwy parametr populacji, a inne nie.
Przedział ufności to zakres wartości, który prawdopodobnie zawiera nieznany parametr populacji. Poziom ufności odnosi się do odsetka prawdopodobieństwa lub pewności, że przedział ufności będzie zawierał prawdziwy parametr populacji podczas wielokrotnego losowania próby losowej. Lub w języku narodowym: „Jesteśmy w 99% pewni ( poziom ufności), że większość tych zbiorów danych (przedziały ufności) zawierają prawdziwy parametr populacji”.
Kluczowe dania na wynos
- Przedział ufności oblicza prawdopodobieństwo, że parametr populacji spadnie między dwie ustawione wartości. Przedziały ufności mierzą stopień niepewności lub pewności w metodzie próbkowania. Najczęściej przedziały ufności odzwierciedlają poziomy ufności 95% lub 99%.
Obliczanie przedziału ufności
Załóżmy, że grupa naukowców bada wysokość licealistów. Naukowcy pobierają losową próbkę z populacji i ustalają średnią wysokość 74 cali. Średnia 74 cali to punktowy szacunek średniej populacji. Samo oszacowanie punktowe ma ograniczoną użyteczność, ponieważ nie ujawnia niepewności związanej z oszacowaniem; nie masz dobrego pojęcia, jak daleko ta 74-calowa średnia próbki może być od średniej populacji. Brakuje tylko stopnia niepewności w tej pojedynczej próbce.
Przedziały ufności dostarczają więcej informacji niż szacunki punktowe. Poprzez ustanowienie 95% przedziału ufności z wykorzystaniem średniej i odchylenia standardowego próbki oraz przyjęcie normalnego rozkładu reprezentowanego przez krzywą dzwonową, badacze dochodzą do górnej i dolnej granicy, która zawiera prawdziwą średnią 95% czasu. Załóżmy, że odstęp wynosi od 72 cali do 76 cali. Jeśli naukowcy pobiorą 100 losowych próbek z populacji licealistów, jako całość, średnia powinna wynosić od 72 do 76 cali w 95 z tych próbek.
Jeśli badacze chcą jeszcze większej pewności siebie, mogą przedłużyć ten przedział do 99% pewności. Takie postępowanie niezmiennie tworzy szerszy zakres, ponieważ robi miejsce na większą liczbę próbek. Jeśli ustalą, że przedział ufności 99% wynosi od 70 cali do 78 cali, mogą spodziewać się, że 99 ze 100 ocenianych próbek będzie zawierać średnią wartość między tymi liczbami. Poziom ufności 90% oznacza, że spodziewalibyśmy się, że 90% szacunków przedziałowych będzie zawierać parametr populacji. Podobnie 99% poziom ufności oznacza, że 95% przedziałów zawiera parametr.
Częste nieporozumienia dotyczące przedziału ufności
Największym nieporozumieniem dotyczącym przedziałów ufności jest to, że reprezentują one procent danych z danej próbki, który mieści się między górną i dolną granicą. Na przykład można błędnie zinterpretować wspomniany powyżej 99% przedział ufności wynoszący od 70 do 78 cali jako wskazujący, że 99% danych w losowej próbce mieści się między tymi liczbami. Jest to niepoprawne, chociaż istnieje taka odrębna metoda analizy statystycznej. W tym celu należy zidentyfikować średnią i odchylenie standardowe próbki oraz wykreślić te liczby na krzywej dzwonowej.