Jaka jest linia najlepszego dopasowania
Linia najlepszego dopasowania odnosi się do linii przechodzącej przez wykres rozproszenia punktów danych, który najlepiej wyraża relację między tymi punktami. Statystycy zazwyczaj używają metody najmniejszych kwadratów, aby dojść do geometrycznego równania linii, zarówno za pomocą ręcznych obliczeń, jak i oprogramowania do analizy regresji. Linia prosta będzie wynikać z prostej analizy regresji liniowej dwóch lub więcej zmiennych niezależnych. Regresja obejmująca wiele powiązanych zmiennych może w niektórych przypadkach spowodować zakrzywioną linię.
Linia najlepszego dopasowania
Podstawy linii najlepszego dopasowania
Linia najlepszego dopasowania jest jednym z najważniejszych wyników analizy regresji. Regresja odnosi się do ilościowej miary zależności między jedną lub większą liczbą zmiennych niezależnych a wynikową zmienną zależną. Regresja jest przydatna dla profesjonalistów z wielu dziedzin, od nauki i usług publicznych po analizy finansowe.
Aby przeprowadzić analizę regresji, statystyki gromadzą zestaw punktów danych, z których każdy zawiera pełny zestaw zmiennych zależnych i niezależnych. Na przykład zmienną zależną może być cena akcji firmy, a zmiennymi niezależnymi może być indeks Standard and Poor's 500 oraz krajowa stopa bezrobocia, przy założeniu, że akcje nie są wymienione w S&P 500. Zestawem próbek może być każdy z nich trzy zestawy danych z ostatnich 20 lat.
Na wykresie te punkty danych wyglądałyby jak wykres rozproszenia, zestaw punktów, które mogą, ale nie muszą być zorganizowane wzdłuż dowolnej linii. Jeśli widoczny jest wzór liniowy, może być możliwe naszkicowanie linii najlepszego dopasowania, która minimalizuje odległość tych punktów od tej linii. Jeśli żadna oś organizacyjna nie jest widoczna, analiza regresji może wygenerować linię w oparciu o metodę najmniejszych kwadratów. Ta metoda buduje linię, która minimalizuje kwadratową odległość każdego punktu od linii najlepszego dopasowania.
Aby ustalić formułę dla tej linii, statystyk wprowadza te trzy wyniki z ostatnich 20 lat do aplikacji do regresji. Oprogramowanie tworzy liniową formułę, która wyraża związek przyczynowy między S&P 500, stopą bezrobocia i ceną akcji danego przedsiębiorstwa. To równanie jest wzorem na linię najlepszego dopasowania. Jest to narzędzie predykcyjne, zapewniające analitykom i handlowcom mechanizm projekcji przyszłej ceny akcji firmy w oparciu o te dwie niezależne zmienne.
Linia równania najlepszego dopasowania i jej elementy
Regresja z dwoma niezależnymi zmiennymi, takimi jak przykład omówiony powyżej, da formułę o następującej podstawowej strukturze:
y = c + b 1 (x 1) + b 2 (x 2)
W tym równaniu y jest zmienną zależną, c jest stałą, b 1 jest pierwszym współczynnikiem regresji, a x 1 jest pierwszą zmienną niezależną. Drugi współczynnik i druga zmienna niezależna to b 2 i x 2. Na podstawie powyższego przykładu cena akcji wyniesie y, S&P 500 wyniesie x 1, a stopa bezrobocia wyniesie x 2. Współczynnik każdej zmiennej niezależnej reprezentuje stopień zmiany y dla każdej dodatkowej jednostki w tej zmiennej. Jeżeli S&P 500 wzrośnie o jeden, wynikowa cena y lub akcji wzrośnie o kwotę współczynnika. To samo dotyczy drugiej niezależnej zmiennej, stopy bezrobocia. W prostej regresji z jedną niezależną zmienną współczynnik ten stanowi nachylenie linii najlepszego dopasowania. W tym przykładzie lub dowolnej regresji z dwiema niezależnymi zmiennymi nachylenie jest mieszanką dwóch współczynników. Stała c to punkt przecięcia linii najlepszego dopasowania.
Kluczowe dania na wynos
- Linia najlepszego dopasowania służy do wyrażenia relacji na wykresie rozrzutu różnych punktów danych. Jest wynikiem analizy regresji i może być używana jako narzędzie prognozowania wskaźników i zmian cen.