Regresji logistycznej: modele i metody

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. regresja logistyczna i analiza dyskryminacyjna są stosowane, gdy jest to konieczne, aby wyraźnie odróżnić respondentom ukierunkowanych kategorie. Ponadto, te grupy są pojedynczymi jednowymiarowe poziom parametrów. а также выясним, для чего она нужна. Rozważyć bardziej szczegółowo model regresji logistycznej, a także dowiedzieć się, co to było za.

Przegląd

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Przykładem tego problemu, w roztworze, który jest używany regresji logistycznej, może być Klasyfikacja badanych przez grupy zakupu i nie kupuje gorczycy. Zróżnicowanie przeprowadzono zgodnie z cechami społeczno-demograficzne. Należą do nich w szczególności należą: wiek, płeć, liczbę członków rodziny, dochód i tak dalej. Są to kryteria różnicowania i zmienna w operacji. Który koduje kategorię, dla której w rzeczywistości należy podzielić badanych.

niuanse

, значительно уже, чем для дискриминантного анализа. Należy stwierdzić, że zakres spraw, w których zastosowane logistyki regresji, znacznie węższy niż analizy dyskryminacyjnej. W związku z tym, zastosowanie tego ostatniego jako uniwersalnego sposobu różnicowania jest uważane za bardziej korzystne. Ponadto eksperci zalecają począwszy od studiów klasyfikacja analizy dyskryminacyjnej. I tylko w przypadku niepewności wyników można stosować regresji logistycznej. Konieczność ta jest spowodowana kilkoma czynnikami. используется при наличии четкого представления о типе независимых и зависимых переменных. regresji logistycznej jest używany, gdy istnieje wyraźna idea o rodzaju niezależnych i zależnych zmiennych. Odpowiednio, wybiera się jeden z 3 możliwych procedur. Gdy analiza dyskryminacyjna, badacz jest zawsze do czynienia z pracy statycznej. Jest zaangażowany jeden zależnych i kilka niezależnych zmiennych kategorycznych ze skalą dowolnego typu.

typy

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. Celem badania statystyczne, które używa regresji logistycznej, jest określenie prawdopodobieństwa, że dany respondent będzie przypisana do określonej grupy. Zróżnicowanie przeprowadzono zgodnie z określonymi parametrami. W praktyce, w zależności od wartości jednej lub więcej niezależnych czynników można podzielić na dwie grupy badanych. . W tym przypadku nie jest binarny regresji logistycznej. Ponadto wymienione parametry mogą być wykorzystane do przydzielenia grupy jest większa niż dwa. W takiej sytuacji nie ma wielomianu regresji logistycznej. Powstałą grupę wyrażone poziomy dowolnej zmiennej.

przykład

Załóżmy, że istnieją odpowiedzi respondentów na pytanie, czy są zainteresowani ofertą nabycia gruntów na przedmieściach Moskwy. W tym przypadku, opcje są „nie” i „tak”. Musimy dowiedzieć się, jakie czynniki mają wpływ na przeważającą decyzji potencjalnych nabywców. Z tego respondenta stawiane są pytania o infrastrukturze terytorium, odległość do stolicy, powierzchni gruntów, obecność / nieobecność budynków mieszkalnych i tak dalej. Za pomocą regresji binarnej, mogą być dystrybuowane w dwóch grupach respondentów. Pierwszy obejmie tych, którzy są zainteresowani zakupem – potencjalnych odbiorców, a po drugie, odpowiednio, tych, którzy nie są zainteresowani taką ofertą. Dla każdego respondenta ponadto zostanie obliczone prawdopodobieństwa przyporządkowania się do jednej kategorii bądź innym.

Charakterystyka porównawcza

W przeciwieństwie do dwóch powyższych postaci wykonania składa się z różnej liczby i rodzaju grup zależnych i zmiennych niezależnych. W regresji binarnej, na przykład, badano zależność współczynnika dychotomiczną z jednym lub więcej niezależnych warunkach. W tym przypadku, może ona być każdego typu skali. regresja wielomianu jest uważane za rodzaj wersji klasyfikacji. Odnosi się do zmiennej zależnej przez więcej niż 2 grupy. Niezależne czynniki muszą mieć albo liczbę porządkową lub skali nominalnej.

Regresji logistycznej w SPSS

Pakiet statystyczny 11-12, wprowadziła nową wersję analizy – sekwencję. Sposób ten jest stosowany, gdy czynnik zależne odnoszą się do tej samej nazwie (porządkowej skali). W tym przypadku zmienne niezależne wybrany jeden konkretny typ. Muszą być porządkowej lub nominalnej. Klasyfikacja w kilku kategoriach jest uważany za najbardziej wszechstronny. Metoda ta może być stosowana we wszystkich badaniach, które wykorzystywane regresji logistycznej. , однако, можно только с помощью всех трех приемов. Poprawy jakości modelu jest jednak możliwe tylko za pomocą wszystkich trzech metod. Jakość regresji logistycznej odpowiedniej walidacji

Klasyfikacja porządkowa

Mówi się, że wcześniej w pakiecie statystycznym nie była przewidziana możliwość przeprowadzenia typowy specjalistyczną analizę czynników zależnych ze skali porządkowej. Dla wszystkich zmiennych, z liczbą grup więcej niż 2 używanych opcji wielomianu. Wprowadzona stosunkowo niedawno analiza sekwencji posiada szereg funkcji. Biorą pod uwagę specyfikę skalować. часто не рассматривается как отдельный прием. Tymczasem w podręcznikach metodologicznych porządkowa regresja logistyczna często nie jest traktowana jako odrębny recepcji. Powód jest następujący: Analiza seryjny nie posiada żadnych istotnych zalet w stosunku do wielomianu. Naukowiec może również jego wykorzystanie w obecności i porządkowej i zmienną zależną nominalnej. W ten sposób proces klasyfikacji są niemal nie do odróżnienia od siebie. Oznacza to, że analiza zamówienie holding nie spowoduje żadnych problemów.

Analiza opcji

Rozważmy prosty przykład – regresję binarną. Na przykład w procesie badań marketingowych szacuje zapotrzebowanie na absolwentów niektórych Metropolitan University. W ankiecie pytano pytań, w tym:

Czy działa? (Ql).
Określ rok Graduation (21 q).
Jaki jest średni wynik z gniazdka (Aver).
Płeć (q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Regresja logistyczna ocenia wpływ niezależnych czynników aver, 21 Q i 22 q ze zmienną QL. Krótko mówiąc, celem analizy jest określenie prawdopodobnego zatrudnienia absolwentów na podstawie informacji na pola, do końca roku, a średni wynik. esicy wskaźnik regresji logistycznej

regresji logistycznej

Aby ustawić parametry za pomocą regresji binarnej, użyj menu Analyze►Regression►Binary logistycznych. W regresji logistycznej do wyboru w lewej liście dostępnych zmiennych czynników zależne. Są to ql. Zmienna ta musi być umieszczona w polu zależnych. Po tym, należy wprowadzić współzmiennych miejscu niezależne czynniki – 21 q, 22 q, Aver. Następnie trzeba wybrać sposób włączając je w analizie. Jeżeli liczba niezależnych czynników więcej niż 2, nie stosować metodę równoczesnego podawania wszystkich zmiennych, które są instalowane domyślnie, i krok po kroku. Najbardziej popularnym sposobem jest uważany tyłu: LR. Korzystanie przycisk Select, nie można uwzględnić w badaniu wszystkich respondentów, a tylko konkretnej kategorii docelowej.

Definiowanie zmiennych kategorycznych

Przycisk kategoryczne do wykorzystania w przypadku, gdy jedna ze zmiennych jest oceniane na liczbę kategorii więcej niż 2. W tej sytuacji, Określ okno skategoryzowanych w stacji kategoryczne współzmiennych umieszczonej właśnie takim rozwiązaniem. W tym przykładzie, taka zmienna nie brakuje. Po tej listy rozwijanej wybierz pozycję Kontrast Odchylenie i kliknij przycisk Zmień. W rezultacie, niektóre ze zmiennych zależnych będzie generowana z każdego czynnika znamionowej. Ich liczba odpowiada liczbie pierwotnych warunków kategoriach.

Zapisz nowe zmienne

Użyj przycisku Zapisz w głównym badaniu jest ustawiony, aby utworzyć nowe okno dialogowe ustawień. Będą one zawierać obliczonych w procesie regresji. W szczególności możliwe jest tworzenie zmiennych, które określają:

Przynależności do określonej kategorii klasyfikacji (Groupmembership).
Prawdopodobieństwa klasyfikacji respondentów w każdej grupie badanej (prawdopodobieństwa).

Przy użyciu przycisku Opcje badacz nie otrzyma żadnych istotnych możliwości. W związku z tym może być ignorowane. Po naciśnięciu przycisku „OK” w oknie głównym zostanie wyświetlone wyniki analizy. Współczynnik regresji logistycznej

Kontrola jakości adekwatności regresji logistycznej

Rozważmy tabela Omnibus Testsof współczynników modelu. Wyświetla wyniki analizy jakości modelu aproksymacji. Ze względu na fakt, że opcja przyrostowe, trzeba obserwować wyniki ostatnim etapie (Krok 2) został ustawiony. Będzie uważany za wynik pozytywny, w którym wykryty wzrost Chi-kwadrat indeks w przejście do następnego kroku w wysokim stopniu istotności (Sig. <0,05). Jakość modelu jest szacowana w modelu linii. Jeśli pojawi się wartość ujemną, ale to nie jest uważana za istotną, jeżeli ogólny wzór wysokiej istotności, ostatni można uznać praktycznie użyteczny.

stoły

Podsumowanie modelu stanowi oszacowanie całkowitego wskaźnika dyspersji, która opisuje konstruowaną modelu (postać R kwadratowych). Zaleca się stosowanie wartości Nagelker. Wskaźnik dodatni mogą być uznane jako parametr Nagelkerke R Square, jeśli jest większa niż 0,50. Następnie oceniano wyniki klasyfikacji, w której rzeczywiste wskaźniki przynależności do tej czy innej kategorii badań są porównywane z tymi przewidywaniami modelu regresji. W tym celu stół do klasyfikacji. To także pozwala na wyciągnięcie wniosków co do poprawności zróżnicowania dla każdej z grupy. Model regresji logistycznej . Poniższa tabela pozwala na znalezienie istotnych statystycznie niezależne czynniki wprowadzone do analizy, jak również czynnik niestandardowych regresji logistycznej. Na podstawie tych wskaźników można przewidzieć przynależność każdego respondenta w próbce do określonej grupy. Nowe zmienne mogą być wprowadzane za pomocą przycisku Zapisz. Będą one zawierać informacje o przynależności do określonej kategorii Klasyfikacja (Predictedcategory) i prawdopodobieństwa integracji w tych grupach (przewidywana członkostwa prawdopodobieństwa). Po naciśnięciu przycisku „OK” w oknie głównym pojawi Wielomianowy logistyczne regresja wyniki obliczeń.

Pierwsza tabela, która zawiera ważne wskaźniki dla badacza, – model Mocowanie informacji. Wysoki poziom istotności statystycznej będzie wskazywać na wysokiej jakości i przydatności stosowania modeli do rozwiązywania problemów praktycznych. Innym ważnym stół jest pseudo R-kwadrat. To pozwala oszacować część całkowitej wariancji czynnika zależnego, które jest spowodowane przez niezależnych zmiennych wybranych do analizy. Zgodnie z tabelą prawdopodobieństwa Testy stosunek może wyciągnąć wnioski co do istotności statystycznej tych ostatnich. Szacunki parametrów odzwierciedlają współczynniki niestandardowych. Są one używane w konstrukcji równania. Ponadto, dla każdej kombinacji zmiennych określa statystycznej istotności ich wpływu na współczynnik zależny. Tymczasem badania rynku jest często niezbędne do rozróżnienia kategorie respondentów nie osobno, lecz jako część grupy docelowej. W tym celu tabela Observedand Przewidywane częstotliwościach.

praktyczne zastosowanie

Uważany metoda analizy jest szeroko stosowany w pracach handlowców. W 1991 roku wskaźnik esicy regresji logistycznej został opracowany. Jest łatwy w użyciu i wydajne narzędzie, które można wykorzystać do przewidywania prawdopodobnych cen do ich „przegrzania”. Wskaźnik jest przedstawiony na wykresie w postaci kanału utworzonego z dwóch linii biegnących równolegle. Usunęli równej odległości od trendu. Szerokość korytarza będzie zależała wyłącznie od czasowych. Wskaźnik jest używany podczas pracy z prawie wszystkich aktywów – od par walutowych do metali szlachetnych.

Regresji logistycznej w SPSS

W praktyce, produkowany 2 główne strategie wykorzystania instrumentu: załamania i odwrócenia. W tym drugim przypadku przedsiębiorca będzie koncentrować się na dynamikę zmian cen w kanale. On jest prawdopodobieństwo, że ruch rozpoczyna się w przeciwnym kierunku, gdyż zbliża się koszt wsparcia lub oporu szybkości linii. Jeśli cena jest ściśle pasuje do górnej granicy, wówczas aktywa mogą być wyeliminowane. Jeśli jest na niższym poziomie, warto pomyśleć o zakupie. Podział strategia polega na wykorzystaniu warrantów. Są one instalowane poza granicami stosunkowo niewielkiej odległości. Biorąc pod uwagę, że cena w niektórych przypadkach narusza je na krótki czas, należy grać bezpiecznie i ustawić stop-loss. W tym samym czasie, oczywiście, niezależnie od wybranej strategii wymaga od przedsiębiorcy, aby zmaksymalizować chłodno postrzegania i oceny sytuacji, która powstała na rynku.

wniosek

Zatem, zastosowanie regresji logistycznej pozwala szybko i łatwo kategoryzować respondentów na kategorie zgodnie z określonymi parametrami. Analizując możliwości wykorzystania określony sposób. W szczególności, różnorodność różnych regresji wielomianowej. Jednak eksperci zalecają stosowanie wszystkich metod opisanych powyżej w kompleksie. Wynika to z faktu, że w tym przypadku jakość modelu będzie znacznie wyższa. To z kolei, rozszerzyć zakres jej stosowania.