Co to jest indukcja wsteczna?
Indukcja wsteczna w teorii gier jest iteracyjnym procesem wnioskowania wstecz w czasie, od końca problemu lub sytuacji, do rozwiązania skończonej rozbudowanej formy i sekwencyjnych gier oraz wnioskowania o sekwencji optymalnych działań.
Wyjaśnienie indukcji wstecznej
Indukcję wsteczną stosowano do rozwiązywania gier, odkąd John von Neumann i Oskar Morgenstern ustanowili teorię gier jako przedmiot akademicki, kiedy w 1944 r. Opublikowali książkę Theory of Games and Economic Behavior .
Na każdym etapie gry indukcja wsteczna określa optymalną strategię gracza, który wykonuje ostatni ruch w grze. Następnie określana jest optymalna akcja następnego gracza w ruchu, biorąc pod uwagę akcję ostatniego gracza. Proces ten trwa do tyłu, aż zostanie określone najlepsze działanie dla każdego punktu w czasie. W efekcie określa się równowagę Nasha w każdej podgrodzie oryginalnej gry.
Jednak wyniki wynikające z indukcji wstecznej często nie przewidują rzeczywistej gry u ludzi. Badania eksperymentalne wykazały, że „racjonalne” zachowanie (jak przewiduje teoria gier) rzadko występuje w prawdziwym życiu. Irracjonalni gracze mogą w rzeczywistości uzyskać wyższe wypłaty niż przewidywane przez indukcję wsteczną, jak pokazano w grze stonogi.
W grze stonoga dwóch graczy naprzemiennie ma szansę wziąć większą część rosnącej puli pieniędzy lub przekazać ją drugiemu graczowi. Wypłaty są ułożone w taki sposób, że jeśli pula zostanie przekazana przeciwnikowi, a przeciwnik przejmie pulę w następnej rundzie, otrzyma się nieco mniej niż w przypadku, gdy ktoś wziął pulę w tej rundzie. Gra kończy się, gdy tylko gracz weźmie skrytkę, przy czym ten gracz otrzymuje większą część, a drugi gracz mniejszą.
Przykład indukcji wstecznej
Jako przykład załóżmy, że Gracz A idzie pierwszy i musi zdecydować, czy powinien „wziąć”, czy „przekazać” skrytkę, która obecnie wynosi 2 USD. Jeśli weźmie, A i B dostaną po 1 USD, ale jeśli A przejdzie, decyzję o podjęciu lub spasowaniu musi podjąć Gracz B. Jeśli B, to dostanie 3 USD (tj. Poprzednią składkę 2 USD + 1 USD) a A dostaje 0 USD. Ale jeśli B przejdzie, A może teraz zdecydować, czy przyjąć, czy spasować itd. Jeśli obaj gracze zawsze decydują się spasować, pod koniec gry każdy z nich otrzymuje wypłatę w wysokości 100 USD.
Chodzi o to, że jeśli zarówno A, jak i B współpracują ze sobą i przechodzą do końca gry, otrzymają maksymalną wypłatę w wysokości 100 USD za każdy. Ale jeśli nie ufają drugiemu graczowi i oczekują, że „wezmą” przy pierwszej okazji, równowaga Nasha przewiduje, że gracze otrzymają najniższe możliwe roszczenie (w tym przypadku 1 USD).
Równowaga Nasha w tej grze, w której żaden gracz nie ma motywacji, by odejść od wybranej strategii po rozważeniu wyboru przeciwnika, sugeruje, że pierwszy gracz wziąłby pulę w pierwszej rundzie gry. Jednak w rzeczywistości robi to stosunkowo niewielu graczy. W rezultacie uzyskują wyższą wypłatę niż wypłatę przewidzianą w analizie równowagi.
Rozwiązywanie gier sekwencyjnych za pomocą indukcji wstecznej
Poniżej znajduje się prosta sekwencyjna gra między dwoma graczami. Etykiety zawierające Gracza 1 i Gracza 2 są zestawami informacji odpowiednio dla jednego lub dwóch graczy. Liczby w nawiasach na dole drzewa to wypłaty w każdym odpowiednim punkcie. Gra jest również sekwencyjna, więc Gracz 1 podejmuje pierwszą decyzję (w lewo lub w prawo), a Gracz 2 podejmuje decyzję po Graczu 1 (w górę lub w dół).
Rycina 1
Indukcja wsteczna, podobnie jak cała teoria gier, wykorzystuje założenia racjonalności i maksymalizacji, co oznacza, że Gracz 2 zmaksymalizuje swoją wypłatę w dowolnej sytuacji. W każdym zestawie informacji mamy dwie możliwości, w sumie cztery. Eliminując wybory, których Gracz 2 nie wybierze, możemy zawęzić nasze drzewo. W ten sposób pogrubimy linie, które maksymalizują wypłatę gracza przy danym zestawie informacji.
Rysunek 2
Po tej obniżce Gracz 1 może zmaksymalizować swoje wypłaty, gdy znane są już Graczowi 2. Rezultatem jest równowaga znaleziona przez wsteczną indukcję Gracza 1 wybierającego „prawo” i Gracza 2 wybierającego „w górę”. Poniżej znajduje się rozwiązanie gry z pogrubioną ścieżką równowagi.
Rycina 3
Na przykład można łatwo skonfigurować grę podobną do powyższej, używając firm jako graczy. Ta gra może zawierać scenariusze wydania produktu. Jeśli Firma 1 chciałaby wydać produkt, co firma 2 może zrobić w odpowiedzi? Czy Firma 2 wyda podobny konkurencyjny produkt? Prognozując sprzedaż tego nowego produktu w różnych scenariuszach, możemy skonfigurować grę, aby przewidzieć, jak potoczą się wydarzenia. Poniżej znajduje się przykład tego, jak można modelować taką grę.
Rycina 4