Regression (Bedeutung, Typen) - Was ist Regressionsanalyse?

Inhaltsverzeichnis

Was ist Regression?

Die Regressionsanalyse ist eine statistische Messung, die in den Bereichen Finanzen, Investitionen usw. verwendet wird und darauf abzielt, eine Beziehung zwischen einer abhängigen Variablen und anderen Reihen unabhängiger Variablen herzustellen. Der Hauptfokus liegt auf der Bestimmung der Stärke der obigen Beziehung.

Erklärungen

  • Um die Regressionsanalyse in der Amtszeit eines Laien zu erklären, nehmen wir an, dass ein Vertriebsleiter eines Unternehmens sich bemüht, den Umsatz des folgenden Monats vorherzusagen. Es gibt zahlreiche Faktoren, die den Verkauf des Produkts antreiben, angefangen vom Wetter bis hin zur neuen Strategie, dem Festival und der Veränderung des Lebensstils der Verbraucher des Konkurrenten.
  • Dies ist eine Methode zur Abstimmung der verschiedenen Faktoren, die den Verkauf beeinflussen und die den größten Einfluss haben. Es kann bei der Beantwortung vieler Fragen hilfreich sein, z. B. was sind die wichtigsten Faktoren, welche Faktoren sind weniger wichtig, wie ist die Beziehung zwischen diesen Faktoren und vor allem, wie sicher diese Faktoren sind.
  • Diese Faktoren werden als Variablen bezeichnet. Der Hauptfaktor, den wir prognostizieren möchten, wird als abhängige Variable bezeichnet, und die anderen Faktoren, die sich auf die abhängige Variable auswirken, werden als unabhängige Variablen bezeichnet.

Formel

Eine einfache lineare Regressionsanalyse in Excel kann wie folgt ausgedrückt werden und misst die Beziehung zwischen einer abhängigen Variablen und einer unabhängigen Variablen.

Y = a + bX + ϵ

Hier:

  • Y - Abhängige Variable
  • X - Unabhängige (erklärende) Variable
  • a - Abfangen
  • b - Steigung
  • ϵ - Rest (Fehler)

Wie interpretiere ich die Regressionsanalyse?

Dies kann unter der Annahme eines einfachen Szenarios interpretiert werden. Hier nehmen wir das Verhältnis zwischen den Preisen der zur Versteigerung stehenden Antiquitätensammlung und der Dauer ihres Alters. Je älter eine Antiquität wird, desto höher ist der Preis, den sie erzielt. Unter der Annahme, dass wir Daten für die letzten 50 versteigerten Artikel festgelegt haben, können wir anhand des Alters des Artikels vorhersagen, wie hoch die zukünftigen Auktionspreise sein werden. Mit diesen Daten können wir eine Regressionsgleichung erstellen.

Die Regressionsformel, die eine Beziehung zwischen Alter und Preis herstellen kann, lautet wie folgt:

y = β0 + β1 x + Fehler
  • Hier ist der abhängige Faktor Y. Y repräsentiert den Preis jedes zu versteigernden Gegenstands, während der unabhängige Faktor X ist, der das Alter bestimmt.
  • Die Parameter β0 und β1 sind Parameter, die nicht bekannt sind und durch die Gleichung geschätzt werden.
  • β0 ist eine Konstante, die zum Definieren der linearen Trendlinie verwendet wird, die die Y-Achse schneidet .
  • β1 ist eine Konstante, die die Größe der Änderung des Wertes der abhängigen Variablen als verwandte Funktion der Änderung zeigt, die mit den unabhängigen Variablen impliziert ist.
  • Dies wird grundsätzlich als Steigung der Gleichung bezeichnet. Wenn die Steigung ein Liner ist, bedeutet dies, dass eine proportionale Beziehung zwischen Alter und Preis besteht, und wenn die Steigung umgekehrt ist, bedeutet dies, dass die Beziehung indirekt proportional ist.
  • Der Fehler kann als Rauschen oder Variation in der Zielvariablen definiert werden und ist zufälliger Natur.

Beispiele aus der Praxis der Regressionsanalyse

Nehmen wir an, wir müssen eine Beziehung zwischen den getätigten Verkäufen und dem Betrag herstellen, der für Werbung im Zusammenhang mit einem Produkt ausgegeben wird.

Generell können wir einen positiven Zusammenhang zwischen der Verkaufsmenge und dem für Werbung ausgegebenen Betrag beobachten. Ausgehend von einer einfachen linearen Regressionsgleichung haben wir:

Y = a + bX

Angenommen, wir erhalten den Wert als

Y = 500 + 30X

Ergebnisinterpretation:

Die prognostizierte Steigung von 30 hilft uns, den Schluss zu ziehen, dass der durchschnittliche Umsatz um 30 USD pro Jahr steigt, wenn die Werbeausgaben steigen.

Arten der Regressionsanalyse

# 1 - Linear

Dies kann wie folgt ausgedrückt werden und misst die Beziehung zwischen einer abhängigen Variablen und einer unabhängigen Variablen.

# 2 - Polynom

Bei dieser Methode wird die Analyse verwendet, um die Beziehung zwischen einzelnen abhängigen Faktoren und mehreren unabhängigen Variablen zu messen.

# 3 - Logistik

Hier ist der abhängige Faktor oder die abhängige Variable binärer Natur. Die unabhängigen Variablen können stetig oder binär sein. Bei der multinomialen logistischen Regression können wir es uns leisten, bei der Auswahl unserer unabhängigen Variablen mehr als zwei Kategorien zu haben.

# 4 - Quantil

Dies ist ein additives Konzept der linearen Regression und wird hauptsächlich verwendet, wenn Ausreißer und Schiefe in den Daten vorhanden sind.

# 5 - Elastisches Netz

Dies ist nützlich, wenn sehr hoch korrelierte unabhängige Variablen verarbeitet werden.

# 6 - Hauptkomponentenregression (PCR)

Dies ist eine Technik, die anwendbar ist, wenn zu viele unabhängige Variablen oder Multikollinearität in den Daten vorhanden sind

# 7 - Teilweise kleinste Quadrate (PLS)

Es ist eine entgegengesetzte Methode der Hauptkomponente, bei der unabhängige Variablen stark korreliert sind. Dies gilt auch, wenn viele unabhängige Variablen vorhanden sind.

# 8 - Support Vector

Dies kann eine Lösung für lineare und nichtlineare Modelle darstellen. Es nutzt nichtlineare Kernelfunktionen, um die optimale Lösung für nichtlineare Modelle zu finden.

# 9 - Ordnungszahl

Es ist anwendbar auf die Vorhersage von Rangwerten. Grundsätzlich ist es geeignet, wenn die abhängige Variable ordinaler Natur ist

# 10 - Poisson

Dies gilt, wenn die abhängige Variable Zähldaten enthält.

# 11 - Negatives Binomial

Es ist auch anwendbar, nur Zähldaten zu verwalten, bei denen eine negative binomiale Regression keine Verteilung der Zählung mit einer Varianz gleich ihrem Mittelwert annimmt, während die Poisson-Regression die Varianz gleich ihrem Mittelwert annimmt.

# 12 - Quasi Poisson

Es ist ein Ersatz für eine negative binomiale Regression. Dies gilt auch für verteilte Zähldaten. Die Varianz eines Quasi-Poisson-Modells ist eine lineare Funktion des Mittelwerts, während die Varianz eines negativen Binomialmodells eine quadratische Funktion des Mittelwerts ist.

# 13 - Cox

Es wird häufiger für die Analyse von Time-to-Event-Daten verwendet.

Unterschied zwischen Regression und Korrelation

  • Die Regression stellt die Beziehung zwischen einer unabhängigen Varianz und einer abhängigen Variablen her, bei der beide Variablen unterschiedlich sind, während die Korrelation die Assoziation oder Abhängigkeit zweier Variablen bestimmt, bei denen zwischen beiden Variablen kein Unterschied besteht.
  • Das Hauptziel der Regression besteht darin, eine Linie der besten Anpassung zu erstellen, und die Schätzung einer Variablen erfolgt auf der Grundlage anderer, während die Korrelation die lineare Beziehung zwischen zwei Variablen demonstriert.
  • Dabei schätzen wir die Größe einer bestimmten Änderung der erkannten Variablen (X) an der geschätzten Variablen (Y), während der Koeffizient in Korrelation verwendet wird, um zu messen, inwieweit sich die beiden Variablen zusammen bewegen.
  • Es ist ein Prozess zum Schätzen der Größe zufälliger unabhängiger Variablen basierend auf der Größe einer statisch abhängigen Variablen, während die Korrelation uns hilft, einen bestimmten Wert zu bestimmen, um die Interdependenz zwischen beiden Variablen auszudrücken.

Fazit

  • Bei der Regressionsanalyse werden hauptsächlich Daten verwendet, um eine Beziehung zwischen zwei oder mehr Variablen herzustellen. Hier wird davon ausgegangen, dass sich in der Vergangenheit bestehende Beziehungen auch in der Gegenwart oder Zukunft widerspiegeln. Nur wenige betrachten dies als eine Zeitverzögerung zwischen Vergangenheit und Gegenwart / Zukunft.
  • Es ist jedoch eine weit verbreitete Prognose- und Schätzmethode. Obwohl es sich um Mathematik handelt, die für viele Benutzer schwierig sein kann, ist die Technik vergleichsweise einfach anzuwenden, insbesondere wenn ein Modell verfügbar ist.

Interessante Beiträge...