506 Shares 7146 views

Regresji Excel: przykłady równanie. regresji liniowej

Analiza regresji – statystyczny metoda badania, aby pokazać zależność parametru jednego lub więcej niezależnych zmiennych. W epoce przed komputerem, jego zastosowanie jest dość trudne, zwłaszcza gdy doszło do dużych ilości danych. Dzisiaj, uczenie się, jak zbudować regresji w programie Excel, można rozwiązać złożone problemy statystyczne w ciągu zaledwie kilku minut. Poniżej przedstawiono konkretne przykłady ekonomii.


rodzaje regresji

Pojęcie to zostało wprowadzone do matematyki przez Francisa Galtona w 1886 roku. Regresja jest:

  • liniowy;
  • paraboliczne;
  • moc;
  • wykładniczy;
  • hiperboliczny;
  • wykładniczy;
  • logarytmiczna.

Przykład 1

Rozważ problem określenia zależność liczby rezygnacji członków personelu średniego wynagrodzenia w 6 przedsiębiorstwach przemysłowych.

Zadaniem. Sześć firm Zbadaliśmy przeciętnego miesięcznego wynagrodzenia i liczby pracowników, którzy rzucili się dobrowolnie. W formie tabelarycznej mamy:

B

C

1

X

Liczba rezygnacji

wynagrodzenie

2

r

30000 rubli

3

1

60

35000 rubli

4

2

35

40000 rubli

5

3

20

45000 rubli

6

4

20

50000 rubli

7

5

15

55000 rubli

8

6

15

60000 rubli

W przypadku problemu określania zależności pracowników ilość separacje od średniej wynagrodzenia 6 przedsiębiorstw modelu regresji ma postać równania: y = A 0 + a 1 x 1 + … + K x K, gdzie x i – zmienne mające wpływ, I – współczynniki regresji ak – szereg czynników.

Y dla danego zadania – jest to wskaźnik, aby zwolnić pracownika, czynnikiem – pensja, która jest oznaczona przez X.

Wykorzystanie mocy „Excel” arkusza kalkulacyjnego

Analiza regresji w programie Excel powinny być poprzedzone wnioskiem do istniejących danych tabeli wbudowanych funkcji. Jednak dla tych celów lepiej jest użyć bardzo użyteczny dodatek „analizy pakietów”. Aby go włączyć, trzeba:

  • z zakładki „Plik” Idź do „Ustawienia”;
  • W oknie, które zostanie otwarte, wybierz „Dodatki”;
  • kliknąć na przycisk „GO”, znajdujący się w prawym dolnym rogu wierszu „zarządzania”;
  • postawić znak wyboru obok „Analysis ToolPak” i potwierdź działanie, naciskając „OK”.

Jeśli wykonane prawidłowo, po prawej stronie zakładki „Dane”, znajduje się nad arkuszem roboczym „Excel”, przedstawia odpowiedni przycisk.

Regresji liniowej w Excelu

Teraz, że masz pod ręką wszystkie niezbędne narzędzia wirtualne dla obliczeń ekonometrycznych, możemy zacząć rozwiązać nasz problem. Aby to zrobić:

  • kliknięciu przycisku na „Analiza danych”;
  • kliknij na przycisk „regresja” w otwartym oknie;
  • języczek, który wydaje się wprowadzenie szeregu wartości Y (liczby rozdzieleń pracowników) i X (wynagrodzenia);
  • potwierdzają swoje działania poprzez naciśnięcie przycisku «OK».

W rezultacie, program automatycznie wypełni nową analizę regresji danych arkusza kalkulacyjnego. Zwrócić uwagę! W programie Excel, istnieje możliwość, aby ustawić miejsce, które wolisz do tego celu. Na przykład, może to być ten sam arkusz, gdzie wartości X i Y, a nawet nowa książka, zaprojektowany specjalnie do przechowywania takich danych.

Wyniki analizy regresji dla R-kwadrat

Dane uzyskane w Excel rozważanych przykład dane mają postać:

Przede wszystkim należy zwrócić uwagę na wartość R-kwadrat. Reprezentuje współczynnik korelacji. W tym przykładzie, R-kwadrat = 0,755 (75,5%), m. E. obliczone parametry modelu, aby wyjaśnić związek pomiędzy parametrów rozważanych przez 75,5%. Im wyższa wartość współczynnika określenia wybrany model jest uważane za bardziej użyteczne dla poszczególnych zadań. Uważa się, że prawidłowo opisują faktycznej sytuacji na wartość R-kwadrat powyżej 0,8. Jeśli R-kwadrat <0,5, a następnie przeprowadzono analizę regresji Excel nie można uznać za uzasadnione.

analiza stosunek

Ilość 64,1428 pokazuje, jaka będzie wartość Y, jeśli wszystkie zmienne xi w naszym modelu zostaną zresetowane. Innymi słowy, można stwierdzić, że wartość analizowanego parametru jest pod wpływem innych czynników, niż te opisane w konkretnym modelu.

Kolejnym czynnikiem -0,16285 się w B18 komórek przedstawia istotny wpływ zmiennej X, Y. Oznacza to, że średnie zarobki pracowników w modelu wpływa na liczbę rezygnacji z ciężaru -0.16285, t. E. stopnia jego oddziaływania na cały mała. Znak „-” oznacza, że współczynnik jest ujemny. Jest to oczywiste, ponieważ wszyscy wiemy, że im bardziej płaca w przedsiębiorstwie, tym mniej osób wyraziło chęć wypowiedzenia umowy o pracę lub odrzucić.

regresji wielokrotnej

Pod pojęcie to odnosi się do równania komunikacji z kilku niezależnych zmiennych, o postaci:

y = f (x 1 + x 2 + … Xm) + ε, gdzie R – stanowi wynik funkcja (zmienna zależna), a X 1, X2 … Xm – są znaki czynniki (zmienne niezależne).

estymacja parametrów

Do regresji wielokrotnej (MR) jest przeprowadzana przy użyciu metody najmniejszych kwadratów (LSM). Równań liniowych o postaci y = a + b 1 x 1 + … + B m x m + ε budowę systemu równań normalnych (cm. Poniżej)

Aby zrozumieć zasadę metody, rozważymy przypadek dwuskładnikowego. Następnie mamy sytuacja opisana za pomocą wzoru

Stąd otrzymujemy:

gdzie σ – wariancja jest odpowiedniej funkcji, odzwierciedlone w indeksie.

MNC ma zastosowanie do równania MR do standartiziruemom skalę. W tym przypadku otrzymujemy równanie:

znamienny t y t x 1, …, T xm standartiziruemye zmiennych dla której średnie wartości 0; p i – znormalizowanych współczynników regresji i odchylenie standardowe – 1.

Należy pamiętać, że wszystkie p I w tym przypadku określana jako znormalizowana i tsentraliziruemye zatem porównania pomiędzy uważane za ważne i akceptowalne. Ponadto przyjmuje się, do przeprowadzenia badań przesiewowych czynników, odrzucając te, które mają najniższe wartości βi.

Problem z wykorzystaniem równania regresji liniowej

Załóżmy, że masz stolik dynamiki cen danego produktu N w ciągu ostatnich 8 miesięcy. Konieczne jest, aby zdecydować, czy nabycie jego partii w cenie 1850 rubli. / T.

B

C

1

miesiąc

Nazwa miesiąca

Cena N

2

1

styczeń

1750 rubli za tonę

3

2

luty

1755 rubli za tonę

4

3

marzec

1767 rubli za tonę

5

4

kwiecień

1760 rubli za tonę

6

5

maj

1770 rubli za tonę

7

6

czerwiec

1790 rubli za tonę

8

7

lipiec

1810 rubli za tonę

9

8

sierpień

1840 rubli za tonę

Aby rozwiązać ten problem w tabelarycznej procesora „Excel” wymagane do korzystania już znane na przykład narzędzia „Analiza danych” przedstawionej powyżej. Następnie należy wybrać sekcję „regresja” i ustaw parametry. Musimy pamiętać, że w „zasięgu wejściowy Y» powinny zostać wprowadzone do zakresu wartości zmiennej zależnej (w tym przypadku ceny towarów w poszczególnych miesiącach roku) oraz w „Input przedział X» – za niezależną (miesiąc). Potwierdzamy akcję klikając «OK». W nowym arkuszu (jeśli tak podane), otrzymujemy dane dla regresji.

Jesteśmy w oparciu o ich liniowe równanie postaci y = ax + b, gdzie jak a parametry a i b są współczynnikami z numerem linii miesiąca i nazwa współczynników i «„linii Y przecięcia arkusza z wynikami analizy regresji. Tak więc, równania regresji liniowej (EQ) 3 do problemu może być zapisana jako:

Cena towaru N = numer 11714 * 1727,54 miesięcy +.

lub w notacji algebraicznej

T = x + 11714 1727,54

Analiza wyników

Aby zdecydować, czy odebrany odpowiednio liniowego równania regresji przy użyciu wielu współczynników korelacji (CMC) i określenie, jak również jako test i t-testu Fishera. W tabeli „Excel” regresji z wynikami działają one pod nazwami wielokrotność R, R-kwadrat, F-t-statystyk i, odpowiednio.

KMC R umożliwia oszacowanie bliskości probabilistyczny zależność pomiędzy zmiennych niezależnych i zależnych. Jego wysoka wartość wskazuje na dość silny związek między zmienną „numer miesiąca” i „N Cena produktu w rubli za 1 tonę.” Jednak charakter tej relacji nie jest znana.

Kwadrat współczynnika określania R2 (RI) jest numeryczny charakterystyczne proporcji całkowitego rozproszenia i wykazuje rozrzut eksperymentalnej części danych, to znaczy wartości zmiennej zależnej odpowiadającej równania regresji liniowej. W ten problem, wartość ta jest 84,8%, temperatura topnienia. E. Statystyki z wysokim stopniem dokładności uzyskanej opisano SD.

F statystyki, znane również jako kryterium Fishera zastosowano do oceny istotności zależność liniową lub podważania hipotezę, potwierdzając jego istnienie.

Wartość statystyki t (test t Studenta) pomaga ocenić znaczenie współczynnika w każdej wolnej nieznanego członka liniowej zależności. Jeżeli wartość testu t> t cr hipoteza liniowego równania nieistotności wolnej termin jest odrzucany.

W tym problem dla wolnego terminu poprzez instrumenty „Excel” stwierdzono, że t = 169,20903, oraz p = 2,89E-12, t. E. Mają prawdopodobieństwo zerowe, że wierni będą odrzucił hipotezę o nieistotności wolnego terminu. Nieznanych współczynnikiem w czasie t = 5,79405, a P = 0,001158. Innymi słowy, prawdopodobieństwo, że zostanie odrzucona hipoteza poprawne znikomości współczynnika dla nieznanego, wynosi 0,12%.

Tak więc, można stwierdzić, że uzyskano równanie regresji liniowej odpowiednio.

Problem celowości zakupu akcji

Regresji wielokrotnej przeprowadzono w programie Excel przy użyciu tej samej funkcji „analiza danych”. Rozważmy konkretną aplikację.

Przewodnik firma «NNN» musi zdecydować, czy do zakupu 20% akcji JSC «MMM». Cena pakietu (SP) jest 70 milionów dolarów. Specjaliści «» NNN zebrano dane na temat podobnych transakcji. Zdecydowano, aby ocenić wartość udziałów o takich parametrach, wyrażony w milionach dolarów amerykańskich, takich jak:

  • zobowiązania (VK);
  • Wielkość rocznego obrotu (VO);
  • należności (Vd);
  • Wartość trwałych (SOF).

Ponadto, korzystając z długów płac przedsiębiorstw (V3 u) w tysiącach dolarów amerykańskich.

Procesor stół decyzja środki Excel

Najpierw trzeba utworzyć tabelę danych wejściowych. Jest to w następujący sposób:

Dalej:

  • call box "analiza danych";
  • Wybrany fragment „regresja”;
  • „okno wejściowe przedział Y» podawany zakres zależne zmienne wartości z kolumny G;
  • kliknij na ikonę z czerwoną strzałką po prawej stronie okna „Wejście przedział X» i samodzielnie na zakresu arkusza wszystkich wartości kolumny B, C, D, F.

Zaznaczyć punkt „Nowy arkusz” i kliknij „OK”.

Dostać analizę regresji dla tego zadania.

Wyniki badań i wnioski

„Zbierać” zaokrąglone z danych przedstawionych powyżej w równaniu Excel regresji procesor tabeli arkusza:

SD = 0,103 * SOF + 0541 * VO – 0031 * VK + 0405 + 0691 * VD * VZP – 265.844.

W bardziej zwykłej postaci matematycznej można zapisać jako:

Y = 0103 * 0541 * x1 + x2 – 0,031 * 0,405 * x3 + x4 + 0691 * x5 – 265.844

Dane dla «MMM» JSC przedstawione w poniższej tabeli:

SOF, USD

VO, USD

VK, USD

VD, USD

VZP, USD

JV, USD

102,5

535,5

45,2

41,5

21,55

64,72

Podstawiając je do równania regresji, uzyskał postać 64.72 milionów dolarów. Oznacza to, że akcje JSC «» MMM nie należy kupować, ponieważ ich koszt jest dość drogie na 70 milionów dolarów.

Jak widać, wykorzystanie arkusza kalkulacyjnego „Excel” i równanie regresji mogą podjąć świadomą decyzję dotyczącą celowości całkiem konkretną transakcję.

Teraz już wiesz, co to regresja. Przykłady do Excela, omówione powyżej, pomoże Ci w rozwiązywaniu praktycznych problemów ekonometrii.