Co to jest błąd próbkowania?
Błąd próbkowania to błąd statystyczny, który występuje, gdy analityk nie wybiera próbki reprezentującej całą populację danych, a wyniki znalezione w próbce nie reprezentują wyników, które można uzyskać z całej populacji. Próbkowanie to analiza przeprowadzana przez wybranie szeregu obserwacji z większej populacji, a wybór może powodować zarówno błędy próbkowania, jak i błędy niezwiązane z próbkowaniem.
Kluczowe dania na wynos
- Błąd próbkowania to błąd statystyczny, który występuje, gdy analityk nie wybiera próbki reprezentującej całą populację danych. Wyniki znalezione w próbce nie reprezentują zatem wyników, które można uzyskać z całej populacji. Błąd próbkowania można zmniejszyć przez losowy dobór próby i / lub zwiększenie liczby obserwacji.
Zrozumienie błędów próbkowania
Błąd próbkowania jest odchyleniem wartości próby od prawdziwej wartości populacji, ponieważ próbka nie jest reprezentatywna dla populacji lub w jakiś sposób jest tendencyjna. Nawet próbki losowe będą miały pewien błąd próbkowania, ponieważ jest to jedynie przybliżenie populacji, z której zostały pobrane.
Błędy próbkowania można wyeliminować, gdy wielkość próby wzrośnie, a także poprzez zapewnienie, że próbka odpowiednio reprezentuje całą populację. Załóżmy na przykład, że firma XYZ zapewnia usługę opartą na subskrypcji, która umożliwia konsumentom uiszczenie miesięcznej opłaty za strumieniowe przesyłanie filmów i innych programów przez Internet.
Firma chce przeprowadzać ankiety wśród właścicieli domów, którzy co tydzień oglądają co najmniej 10 godzin programowania przez Internet i płacą za istniejącą usługę przesyłania strumieniowego wideo. XYZ chce ustalić, jaki procent populacji jest zainteresowany tańszą usługą subskrypcji. Jeśli XYZ nie przemyśli dokładnie procesu próbkowania, może wystąpić kilka rodzajów błędów próbkowania.
Przykłady błędów próbkowania
Błąd specyfikacji populacji oznacza, że XYZ nie rozumie konkretnych rodzajów konsumentów, którzy powinni zostać objęci próbą. Jeśli na przykład XYZ tworzy populację osób w wieku od 15 do 25 lat, wielu z tych konsumentów nie podejmuje decyzji o zakupie usługi przesyłania strumieniowego wideo, ponieważ nie pracuje w pełnym wymiarze godzin. Z drugiej strony, jeśli XYZ zgromadzi próbkę pracujących dorosłych, którzy podejmują decyzje zakupowe, konsumenci w tej grupie mogą nie oglądać 10 godzin programów wideo w każdym tygodniu.
Błąd wyboru powoduje również zniekształcenie wyników próby, a częstym przykładem jest ankieta, która polega tylko na niewielkiej części osób, które natychmiast reagują. Jeśli XYZ podejmie wysiłki, aby skontaktować się z konsumentami, którzy początkowo nie odpowiedzą, wyniki ankiety mogą ulec zmianie. Ponadto, jeśli XYZ wykluczy konsumentów, którzy nie odpowiedzą od razu, wyniki próby mogą nie odzwierciedlać preferencji całej populacji.
Faktoring w błędach niezwiązanych z próbkowaniem
XYZ chce także uniknąć błędów niezwiązanych z próbkowaniem, które są spowodowane błędem ludzkim, takim jak błąd popełniony w procesie ankietowym. Jeśli jedna grupa konsumentów ogląda tylko pięć godzin programowania wideo w tygodniu i jest uwzględniona w ankiecie, decyzja ta jest błędem niezwiązanym z próbą. Innym rodzajem błędu jest zadawanie stronniczych pytań.
