Co to jest rozkład dwumianowy?
Rozkład dwumianowy to rozkład prawdopodobieństwa, który podsumowuje prawdopodobieństwo, że wartość przyjmie jedną z dwóch niezależnych wartości przy danym zestawie parametrów lub założeń. Podstawowymi założeniami rozkładu dwumianowego jest to, że dla każdej próby istnieje tylko jeden wynik, że każda próba ma takie samo prawdopodobieństwo sukcesu oraz że każda próba wzajemnie się wyklucza lub jest od siebie niezależna.
Rozkład dwumianowy jest powszechnym rozkładem dyskretnym stosowanym w statystyce, w przeciwieństwie do rozkładu ciągłego, takiego jak rozkład normalny. Jest tak, ponieważ rozkład dwumianowy liczy tylko dwa stany, zwykle reprezentowane jako 1 (w przypadku sukcesu) lub 0 (w przypadku niepowodzenia), biorąc pod uwagę liczbę prób w danych. Rozkład dwumianowy reprezentuje zatem prawdopodobieństwo x sukcesów w n próbach, biorąc pod uwagę prawdopodobieństwo powodzenia p dla każdej próby.
Rozkład dwumianowy jest często wykorzystywany w statystykach nauk społecznych jako podstawa modeli dla dychotomicznych zmiennych wyników, takich jak to, czy republikanin czy demokrata wygra nadchodzące wybory, czy dana osoba umrze w określonym czasie itp.
Zrozumienie rozkładu dwumianowego
Rozkład dwumianowy podsumowuje liczbę prób lub obserwacji, gdy każda próba ma takie samo prawdopodobieństwo osiągnięcia jednej konkretnej wartości. Rozkład dwumianowy określa prawdopodobieństwo zaobserwowania określonej liczby udanych wyników w określonej liczbie prób.
Oczekiwaną wartość lub średnią rozkładu dwumianowego oblicza się, mnożąc liczbę prób przez prawdopodobieństwo sukcesu. Na przykład oczekiwana wartość liczby głów w 100 próbach wynosi 50 lub (100 * 0, 5). Innym częstym przykładem rozkładu dwumianowego jest oszacowanie szans na sukces strzelca rzutów wolnych w koszykówce, gdzie 1 = koszyk jest zrobiony, a 0 = chybiony.
Średnia rozkładu dwumianowego wynosi np, a wariancja rozkładu dwumianowego wynosi np (1 - p). Gdy p = 0, 5, rozkład jest symetryczny wokół średniej. Gdy p> 0, 5, rozkład jest przekrzywiony w lewo. Gdy p <0, 5, rozkład jest przekrzywiony w prawo.
Rozkład dwumianowy jest sumą serii wielu niezależnych i identycznie rozmieszczonych prób Bernoulliego. W próbie Bernoulliego mówi się, że eksperyment jest losowy i może przynieść tylko dwa możliwe wyniki: sukces lub porażka. Na przykład rzut monetą jest uważany za proces Bernoulliego; każda próba może przyjąć tylko jedną z dwóch wartości (główki lub ogony), każdy sukces ma takie samo prawdopodobieństwo (prawdopodobieństwo przewrócenia głowy wynosi 0, 5), a wyniki jednej próby nie wpływają na wyniki innej. Rozkład Bernoulliego jest szczególnym przypadkiem rozkładu dwumianowego, w którym liczba prób n = 1.
Przykład rozkładu dwumianowego
Rozkład dwumianowy oblicza się poprzez pomnożenie prawdopodobieństwa sukcesu podniesionego do potęgi liczby sukcesów i prawdopodobieństwa niepowodzenia podniesionego do potęgi różnicy między liczbą sukcesów a liczbą prób. Następnie pomnóż produkt przez kombinację liczby prób i liczby sukcesów.
Załóżmy na przykład, że kasyno stworzyło nową grę, w której uczestnicy mogą obstawiać liczbę głów lub reszek w określonej liczbie rzutów monetą. Załóżmy, że uczestnik chce postawić zakład za 10 USD, że w 20 rzutach monetą będzie dokładnie sześć głów. Uczestnik chce obliczyć prawdopodobieństwo takiego wystąpienia, dlatego wykorzystuje obliczenia do rozkładu dwumianowego. Prawdopodobieństwo obliczono jako: (20! / (6! * (20 - 6))) * (0, 50) ^ (6) * (1 - 0, 50) ^ (20 - 6). W związku z tym prawdopodobieństwo wystąpienia dokładnie sześciu głów w 20 rzutach monetą wynosi 0, 037, czyli 3, 7%. Oczekiwana wartość wynosiła w tym przypadku 10 głów, więc uczestnik źle postawił.
Kluczowe dania na wynos
- Rozkład dwumianowy to rozkład prawdopodobieństwa, który podsumowuje prawdopodobieństwo, że wartość przyjmie jedną z dwóch niezależnych wartości przy danym zestawie parametrów lub założeń. Podstawowymi założeniami rozkładu dwumianowego jest to, że dla każdego badania istnieje tylko jeden wynik, że każda próba ma takie samo prawdopodobieństwo sukcesu i że każda próba jest wzajemnie wykluczająca się lub niezależna od siebie. Rozkład dwumianowy jest powszechnym rozkładem dyskretnym stosowanym w statystyce, w przeciwieństwie do rozkładu ciągłego, takiego jak rozkład normalny.
