Co to jest stronniczość wyboru próbek?
Błąd selekcji próbek jest rodzajem błędu wynikającego z wyboru nieprzypadkowych danych do analizy statystycznej. Taki błąd występuje z powodu błędu w procesie doboru próby, w którym podzbiór danych jest systematycznie wykluczany z powodu określonego atrybutu. Wykluczenie podzbioru może wpływać na istotność statystyczną testu lub powodować zniekształcone wyniki.
Zrozumienie odchylenia w doborze próby
Błąd polegający na przeżyciu jest powszechnym typem błędu selekcji próbek. Na przykład podczas weryfikacji historycznej strategii inwestycyjnej dla dużej grupy akcji, wygodne może być poszukiwanie papierów wartościowych, które zawierają dane dla całego okresu próby. Gdybyśmy mieli przetestować strategię na podstawie danych o zapasach z 15 lat, moglibyśmy być skłonni szukać zapasów, które mają pełne informacje przez cały okres 15 lat. Jednak wyeliminowanie akcji, która przestała handlować lub wkrótce opuściła rynek, wprowadziłaby błąd w naszej próbie danych. Ponieważ uwzględniamy tylko akcje, które trwały 15 lat, nasze ostateczne wyniki byłyby błędne, ponieważ były one wystarczająco dobre, aby przetrwać na rynku.
Wskaźniki wydajności funduszy hedgingowych są jednym z przykładów stronniczości doboru próby podlegającej tendencyjności przeżycia. Ponieważ fundusze hedgingowe, które nie przetrwają, przestają raportować swoje wyniki agregatorom indeksów, powstałe wskaźniki są naturalnie przechylane na fundusze i strategie, które pozostają, a zatem „przetrwają”. Może to być problem również z popularnymi usługami raportowania funduszy wzajemnych.
Analitycy mogą dostosować się, aby uwzględnić te uprzedzenia, ale mogą wprowadzić w tym procesie uprzedzenia informacyjne.