R-Quadrat (R ^ 2) - Definition, Formel, R-Quadrat berechnen

Was ist R-Quadrat (R2) in der Regression?

Das R-Quadrat (R 2 ) ist ein wichtiges statistisches Maß, bei dem es sich um ein Regressionsmodell handelt, das den Anteil der Differenz oder Varianz in statistischen Begriffen für eine abhängige Variable darstellt, der durch eine oder mehrere unabhängige Variablen erklärt werden kann. Kurz gesagt, es wird bestimmt, wie gut Daten zum Regressionsmodell passen.

R Quadratische Formel

Für die Berechnung des R-Quadrats müssen Sie den Korrelationskoeffizienten bestimmen und dann das Ergebnis quadrieren.

R Quadratformel = r 2

Wobei r der Korrelationskoeffizient wie folgt berechnet werden kann:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Wo,

  • r = Der Korrelationskoeffizient
  • n = Nummer im angegebenen Datensatz
  • x = erste Variable im Kontext
  • y = zweite Variable

Erläuterung

Wenn zwischen diesen beiden Variablen eine Beziehung oder Korrelation besteht, die linear oder nicht linear sein kann, muss angegeben werden, ob sich der Wert der unabhängigen Variablen ändert, und die andere abhängige Variable ändert sich wahrscheinlich im Wert, beispielsweise linear oder nicht linear.

Der Zählerteil der Formel führt einen Test durch, ob sie sich zusammen bewegen, und entfernt ihre individuellen Bewegungen und die relative Stärke von beiden, die sich zusammen bewegen, und der Nennerteil der Formel skaliert den Zähler, indem er die Quadratwurzel des Produkts aus den Differenzen von zieht die Variablen aus ihren quadratischen Variablen. Und wenn Sie dieses Ergebnis quadrieren, erhalten wir R im Quadrat, was nichts anderes als der Bestimmungskoeffizient ist.

Beispiele

Beispiel 1

Betrachten Sie die folgenden zwei Variablen x und y. Sie müssen das R-Quadrat in der Regression berechnen.

Lösung:

Unter Verwendung der oben genannten Formel müssen wir zuerst den Korrelationskoeffizienten berechnen.

Wir haben alle Werte in der obigen Tabelle mit n = 4.

Geben Sie nun die Werte in die Formel ein, um zur Abbildung zu gelangen.

r = (4 · 26.046,25) - (265,18 · 326,89) / √ ((4 · 21.274,94) - (326,89) 2 ) · ((4 · 31.901,89) - (326,89) 2 )

r = 17.501,06 / 17.512,88

Der Korrelationskoeffizient wird

r = 0,99932480

Die Berechnung lautet also wie folgt:

r 2 = (0,99932480) 2

R Quadratformel in Regression

r 2 = 0,998650052

Beispiel 2

Indien, ein Entwicklungsland, möchte eine unabhängige Analyse durchführen, ob Änderungen der Rohölpreise seinen Rupienwert beeinflusst haben. Es folgt die Geschichte des Brent-Rohölpreises und der Rupienbewertung, beide gegenüber dem Dollar, der im Durchschnitt für diese Jahre pro Jahr vorherrschte.

RBI, die indische Zentralbank, hat sich an Sie gewandt, um in der nächsten Sitzung eine Präsentation darüber zu halten. Bestimmen Sie, ob die Bewegungen des Rohöls die Bewegungen der Rupie pro Dollar beeinflussen?

Lösung:

Unter Verwendung der obigen Formel für die Korrelation können wir zuerst den Korrelationskoeffizienten berechnen. Behandlung des durchschnittlichen Rohölpreises als eine Variable, z. B. x, und Behandlung der Rupie pro Dollar als eine weitere Variable als y.

Wir haben alle Werte in der obigen Tabelle mit n = 6.

Geben Sie nun die Werte in die Formel ein, um zur Abbildung zu gelangen.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1,715,95

Der Korrelationskoeffizient wird

r = -0,3614

Die Berechnung lautet also wie folgt:

r 2 = (-0,3614) 2

R Quadratformel in Regression

r 2 = 0,1306

Analyse: Es scheint, dass ein geringfügiger Zusammenhang zwischen Änderungen der Rohölpreise und Änderungen des Preises der indischen Rupie besteht. Mit steigendem Rohölpreis wirken sich auch die Veränderungen der indischen Rupie aus. Da das R-Quadrat jedoch nur 13% beträgt, erklären die Änderungen des Rohölpreises weniger Änderungen der indischen Rupie, und die indische Rupie unterliegt auch Änderungen anderer Variablen, die berücksichtigt werden müssen.

Beispiel 3

Das XYZ-Labor erforscht Größe und Gewicht und ist daran interessiert zu wissen, ob zwischen diesen Variablen irgendeine Beziehung besteht. Nach dem Sammeln einer Stichprobe von 5000 Personen für jede Kategorie und einem durchschnittlichen Gewicht und einer durchschnittlichen Größe in dieser bestimmten Gruppe.

Unten sind die Details, die sie gesammelt haben.

Sie müssen das R-Quadrat berechnen und daraus schließen, ob dieses Modell erklärt, dass die Höhenabweichungen die Gewichtsabweichungen beeinflussen.

Lösung:

Unter Verwendung der obigen Formel für die Korrelation können wir zuerst den Korrelationskoeffizienten berechnen. Behandeln der Größe als eine Variable, z. B. x, und Behandeln des Gewichts als eine andere Variable als y.

Wir haben alle Werte in der obigen Tabelle mit n = 6.

Geben Sie nun die Werte in die Formel ein, um zur Abbildung zu gelangen.

r = (7 · 74.058,67) - (1031 · 496,44) / √ ((7 · 153595 - (1031) 2 ) · ((7 · 35793,59) - (496,44) 2 )

r = 6.581,05 / 7.075,77

Der Korrelationskoeffizient wird

Korrelationskoeffizient (r) = 0,9301

Die Berechnung lautet also wie folgt:

r 2 = 0,8651

Analyse: Die Korrelation ist positiv und es scheint eine Beziehung zwischen Größe und Gewicht zu bestehen. Mit zunehmender Größe scheint auch das Gewicht der Person zuzunehmen. Während R2 vorschlägt, dass 86% der Änderungen der Körpergröße auf Änderungen des Gewichts zurückzuführen sind und 14% ungeklärt sind.

Relevanz und Verwendung

Die Relevanz des R-Quadrats in der Regression ist seine Fähigkeit, die Wahrscheinlichkeit zukünftiger Ereignisse innerhalb der gegebenen vorhergesagten Ergebnisse oder der Ergebnisse zu ermitteln. Wenn dem Modell weitere Stichproben hinzugefügt werden, zeigt der Koeffizient die Wahrscheinlichkeit oder die Wahrscheinlichkeit, dass ein neuer Punkt oder der neue Datensatz auf die Linie fällt. Selbst wenn beide Variablen einen starken Zusammenhang haben, beweist die Bestimmung keine Kausalität.

Einige der Bereiche, in denen das Quadrat R hauptsächlich verwendet wird, dienen zur Verfolgung der Performance von Investmentfonds, zur Verfolgung des Risikos in Hedge-Fonds, um zu bestimmen, wie gut sich die Aktie mit dem Markt bewegt, wobei R2 vorschlagen würde, wie viel von den Bewegungen der Aktie erklärt werden kann durch die Bewegungen auf dem Markt.

Interessante Beiträge...