Co to jest przeuczenie?
Przeregulowanie to błąd modelowania, który występuje, gdy funkcja jest zbyt ściśle dopasowana do ograniczonego zestawu punktów danych. Nadmierne dopasowanie modelu ogólnie polega na stworzeniu zbyt złożonego modelu w celu wyjaśnienia osobliwości badanych danych.
W rzeczywistości często badane dane zawierają pewien stopień błędu lub przypadkowego szumu. Dlatego też próba zbyt ścisłego dopasowania modelu do nieco niedokładnych danych może zainfekować model poważnymi błędami i zmniejszyć jego moc predykcyjną.
Kluczowe dania na wynos
- Przeregulowanie to błąd modelowania, który pojawia się, gdy funkcja jest zbyt ściśle dopasowana do ograniczonego zestawu punktów danych. Specjaliści ds. Finansów muszą zawsze zdawać sobie sprawę z niebezpieczeństw związanych z przeregulowaniem modelu w oparciu o ograniczone dane.
Zrozumienie nadmiernego dopasowania
Na przykład częstym problemem jest używanie algorytmów komputerowych do przeszukiwania rozległych baz danych historycznych danych rynkowych w celu znalezienia wzorców. Biorąc pod uwagę wystarczającą liczbę badań, często możliwe jest opracowanie szczegółowych twierdzeń, które wydają się przewidywać z dużą dokładnością takie rzeczy, jak zwroty z rynku akcji.
Jednak w przypadku zastosowania do danych poza próbą, te twierdzenia mogą prawdopodobnie okazać się po prostu zbyt dużym dopasowaniem modelu do tego, co w rzeczywistości było przypadkowymi przypadkami. We wszystkich przypadkach ważne jest przetestowanie modelu pod kątem danych spoza próby użytej do jego opracowania.
Specjaliści finansowi muszą zawsze zdawać sobie sprawę z niebezpieczeństw związanych z nadmiernym dopasowaniem modelu opartego na ograniczonych danych.
