Co to jest modelowanie predykcyjne?
Modelowanie predykcyjne to proces wykorzystywania znanych wyników do tworzenia, przetwarzania i sprawdzania poprawności modelu, który można wykorzystać do prognozowania przyszłych wyników. Jest to narzędzie wykorzystywane w analizie predykcyjnej, technice eksploracji danych, która próbuje odpowiedzieć na pytanie „co może się wydarzyć w przyszłości?”
Zrozumienie modelowania predykcyjnego
Szybka migracja do produktów cyfrowych stworzyła morze danych, które są łatwo dostępne i dostępne dla firm. Firmy wykorzystują duże zbiory danych do poprawy dynamiki relacji klient-firma. Ta ogromna ilość danych w czasie rzeczywistym pozyskiwana jest ze źródeł takich jak media społecznościowe, historia przeglądania Internetu, dane z telefonów komórkowych i platformy przetwarzania w chmurze.
Analizując wydarzenia historyczne, istnieje prawdopodobieństwo, że firma będzie w stanie przewidzieć, co się wydarzy w przyszłości i odpowiednio zaplanować. Jednak dane te są zwykle nieustrukturyzowane i zbyt skomplikowane, aby ludzie mogli je analizować w krótkim czasie. Ze względu na złożoność ogromnych ilości danych firmy coraz częściej korzystają z narzędzi analizy predykcyjnej w celu prognozowania wyniku zdarzenia, które może nastąpić w najbliższej przyszłości.
Jak działa analityka predykcyjna
Analityka predykcyjna gromadzi i przetwarza dane historyczne w ogromnych ilościach i wykorzystuje potężne komputery do oceny tego, co wydarzyło się w przeszłości, a następnie zapewnia ocenę tego, co stanie się w przyszłości.
Analityka predykcyjna wykorzystuje predyktory lub znane funkcje do tworzenia modeli predykcyjnych, które będą używane w celu uzyskania wyniku. Model predykcyjny jest w stanie dowiedzieć się, w jaki sposób różne punkty danych łączą się ze sobą. Dwie najczęściej stosowane techniki modelowania predykcyjnego to regresja i sieci neuronowe.
Firmy coraz częściej korzystają z modelowania predykcyjnego, aby przewidywać zdarzenia, które mogą się wydarzyć w najbliższej przyszłości.
Uwagi specjalne
W dziedzinie statystyki regresja odnosi się do liniowej zależności między zmiennymi wejściowymi i wyjściowymi. Model predykcyjny z funkcją liniową wymaga jednego predyktora lub cechy, aby przewidzieć wynik / wynik. Na przykład bank, który ma nadzieję wykryć pranie pieniędzy we wczesnych stadiach, może zastosować liniowy model predykcyjny.
Bank szczególnie chce wiedzieć, który z jego klientów może w pewnym momencie zaangażować się w pranie pieniędzy. Wszystkie dane klientów banku są prezentowane, a model predykcyjny jest budowany wokół wartości w dolarach przelewów dokonywanych przez każdego klienta w danym okresie.
Model uczy się rozpoznawania różnicy między transakcją prania pieniędzy a normalną transakcją. Optymalny wynik z modelu powinien być wzorem, który sygnalizuje, który klient wyprał pieniądze, a który nie. Jeśli model zauważy, że pojawia się wzór oszustwa dla konkretnego klienta, stworzy sygnał do działania, w którym wezmą udział analitycy oszustwa banku.
Modele predykcyjne są również stosowane w sieciach neuronowych, takich jak uczenie maszynowe i uczenie głębokie, które są dziedzinami sztucznej inteligencji (AI). Sieci neuronowe są inspirowane ludzkim mózgiem i są tworzone za pomocą sieci połączonych węzłów na poziomach hierarchicznych, które stanowią fundament sztucznej inteligencji. Siła sieci neuronowych polega na ich zdolności do radzenia sobie z nieliniowymi relacjami danych. Są w stanie tworzyć relacje i wzorce między zmiennymi, które okazałyby się niemożliwe lub zbyt czasochłonne dla ludzkich analityków.
Kluczowe dania na wynos
- Modelowanie predykcyjne to proces wykorzystywania znanych wyników do tworzenia, przetwarzania i sprawdzania poprawności modelu, który można wykorzystać do prognozowania w przyszłości. Dwie z najczęściej stosowanych technik modelowania predykcyjnego to regresja i sieci neuronowe.
Tak więc, podczas gdy bank może wprowadzać do swojego modelu znane zmienne, takie jak wartość przelewów zainicjowanych przez jego klientów, aby uzyskać pożądany rezultat tego, kto prawdopodobnie zaangażuje się w pranie pieniędzy, sieć neuronowa może stworzyć silniejszy wzór, jeśli może z powodzeniem stwórz relację między zmiennymi wejściowymi, takimi jak czas zalogowania, lokalizacja geograficzna użytkownika, adres IP urządzenia użytkownika, odbiorca lub nadawca funduszy, i dowolna inna funkcja, która może stanowić pranie.
Inne techniki modelowania predykcyjnego stosowane przez firmy finansowe obejmują drzewa decyzyjne, eksplorację danych szeregów czasowych i analizę bayesowską. Firmy, które korzystają z dużych zbiorów danych za pomocą predykcyjnych metod modelowania, lepiej rozumieją, w jaki sposób ich klienci angażują się w ich produkty, i mogą identyfikować potencjalne ryzyko i szanse dla firmy.