Pearson-Korrelationskoeffizient (Formel, Beispiel) - Berechnen Sie Pearson R.

Definition des Pearson-Korrelationskoeffizienten

Der Pearson-Korrelationskoeffizient, auch als statistischer Pearson R-Test bekannt, misst die Stärke zwischen den verschiedenen Variablen und ihren Beziehungen. Wenn ein statistischer Test zwischen den beiden Variablen durchgeführt wird, ist es für die Person, die die Analyse durchführt, immer eine gute Idee, den Wert des Korrelationskoeffizienten zu berechnen, um zu wissen, wie stark die Beziehung zwischen den beiden Variablen ist.

Der Pearson-Korrelationskoeffizient gibt einen Wert zwischen -1 und 1 zurück. Die Interpretation des Korrelationskoeffizienten lautet wie folgt:

  • Wenn der Korrelationskoeffizient -1 ist, zeigt dies eine starke negative Beziehung an. Dies impliziert eine perfekte negative Beziehung zwischen den Variablen.
  • Wenn der Korrelationskoeffizient 0 ist, zeigt dies keine Beziehung an.
  • Wenn der Korrelationskoeffizient 1 ist, zeigt dies eine starke positive Beziehung an. Dies impliziert eine perfekte positive Beziehung zwischen den Variablen.

Ein höherer absoluter Wert des Korrelationskoeffizienten zeigt eine stärkere Beziehung zwischen Variablen an. Somit zeigt ein Korrelationskoeffizient von 0,78 eine stärkere positive Korrelation im Vergleich zu einem Wert von beispielsweise 0,36 an. In ähnlicher Weise zeigt ein Korrelationskoeffizient von -0,87 eine stärkere negative Korrelation im Vergleich zu einem Korrelationskoeffizienten von beispielsweise -0,40 an.

Mit anderen Worten, wenn der Wert im positiven Bereich liegt, zeigt dies, dass die Beziehung zwischen Variablen positiv korreliert ist und beide Werte zusammen abnehmen oder zunehmen. Wenn andererseits der Wert im negativen Bereich liegt, zeigt dies, dass die Beziehung zwischen Variablen negativ korreliert ist und beide Werte in die entgegengesetzte Richtung gehen.

Pearson-Korrelationskoeffizientenformel

Die Pearson-Korrelationskoeffizientenformel lautet wie folgt:

Wo,

  • r = Pearson-Koeffizient
  • n = Anzahl der Aktienpaare
  • ∑xy = Summe der Produkte der gepaarten Bestände
  • ∑x = Summe der x-Punkte
  • ∑y = Summe der y-Werte
  • ∑x 2 = Summe der quadratischen x-Werte
  • ∑y 2 = Summe der quadratischen y-Werte

Erläuterung

Schritt 1: Ermitteln Sie die Anzahl der Variablenpaare, die mit n bezeichnet wird. Nehmen wir an, x besteht aus 3 Variablen - 6, 8, 10. Nehmen wir an, dass y aus den entsprechenden 3 Variablen 12, 10, 20 besteht.

Schritt 2: Listen Sie die Variablen in zwei Spalten auf.

Schritt 3: Das Produkt von x und y in der 3 finden Sie mit rd Spalte.

Schritt 4: Ermitteln Sie die Summe der Werte aller x-Variablen und aller y-Variablen. Schreiben die Ergebnisse am Ende des 1 st und 2 nd Spalte. Schreibt die Summe von x * y in der 3 rd Spalte.

Schritt 5: Finden Sie heraus , x 2 und y 2 im 4 - ten und 5 - ten Spalten und deren Summe am unteren Rand der Spalten.

Schritt 6: Fügen Sie die oben angegebenen Werte in die Formel ein und lösen Sie sie.

r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )

= 0,7559

Beispiel für den Pearson-Korrelationskoeffizienten R.

Beispiel 1

In diesem Beispiel mit Hilfe der folgenden Details in der Tabelle der 6 Personen mit einem unterschiedlichen Alter und unterschiedlichen Gewichten, die unten für die Berechnung des Wertes des Pearson R angegeben sind

Sr. Nr Alter (x) Gewicht (y)
1 40 78
2 21 70
3 25 60
4 31 55
5 38 80
6 47 66

Lösung:

Für die Berechnung des Pearson-Korrelationskoeffizienten berechnen wir zunächst die folgenden Werte:

Hier beträgt die Gesamtzahl der Personen 6, also n = 6

Nun ist die Berechnung des Pearson R wie folgt:

  • r = (n (∑xy) - (∑x) (∑y)) / (√ (n ∑x 2 - (∑x) 2 ) (n ∑y 2 - (∑y) 2 )
  • r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (83622-82618) / (√ (43680-40804) * (170190-167281)
  • r = 1004 / (√ (2876) * (2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

Somit beträgt der Wert des Pearson-Korrelationskoeffizienten 0,35

Beispiel 2

Es gibt 2 Aktien - A und B. Ihre Aktienkurse an bestimmten Tagen sind wie folgt:

Lager A (x) Stcok B (y)
45 9
50 8
53 8
58 7
60 5

Ermitteln Sie den Pearson-Korrelationskoeffizienten aus den obigen Daten.

Lösung:

Zunächst berechnen wir die folgenden Werte.

Die Berechnung des Pearson-Koeffizienten ist wie folgt:

  • r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
  • = -0,9088

Daher beträgt der Pearson-Korrelationskoeffizient zwischen den beiden Aktien -0,9088.

Vorteile

  • Es hilft zu wissen, wie stark die Beziehung zwischen den beiden Variablen ist. Mit dem Pearson-Korrelationskoeffizienten wird nicht nur das Vorhandensein oder Nichtvorhandensein der Korrelation zwischen den beiden Variablen angezeigt, sondern es wird auch das genaue Ausmaß bestimmt, in dem diese Variablen korreliert sind.
  • Mit dieser Methode kann man die Korrelationsrichtung ermitteln, dh ob die Korrelation zwischen zwei Variablen negativ oder positiv ist.

Nachteile

  • Der Pearson-Korrelationskoeffizient R reicht nicht aus, um den Unterschied zwischen den abhängigen Variablen und den unabhängigen Variablen festzustellen, da der Korrelationskoeffizient zwischen den Variablen symmetrisch ist. Wenn eine Person beispielsweise versucht, die Korrelation zwischen hohem Stress und Blutdruck zu kennen, kann man den hohen Wert der Korrelation finden, der zeigt, dass hoher Stress den Blutdruck verursacht. Wenn nun die Variable umgeschaltet wird, ist das Ergebnis in diesem Fall auch dasselbe, was zeigt, dass Stress durch den Blutdruck verursacht wird, was keinen Sinn ergibt. Daher sollte der Forscher die Daten kennen, die er für die Durchführung der Analyse verwendet.
  • Mit dieser Methode kann man keine Informationen über die Steigung der Linie erhalten, da nur angegeben wird, ob eine Beziehung zwischen den beiden Variablen besteht oder nicht.
  • Es ist wahrscheinlich, dass der Pearson-Korrelationskoeffizient falsch interpretiert wird, insbesondere bei homogenen Daten.
  • Im Vergleich zu den anderen Berechnungsmethoden benötigt diese Methode viel Zeit, um zu den Ergebnissen zu gelangen.

Wichtige Punkte

  • Die Werte können vom Wert +1 bis zum Wert -1 reichen, wobei +1 die perfekte positive Beziehung zwischen den betrachteten Variablen angibt, -1 die perfekte negative Beziehung zwischen den betrachteten Variablen angibt und ein 0-Wert angibt, dass keine Beziehung besteht existiert zwischen den betrachteten Variablen.
  • Sie ist unabhängig von der Maßeinheit der Variablen. Wenn beispielsweise die Maßeinheit einer Variablen in Jahren angegeben ist, während die Maßeinheit der zweiten Variablen in Kilogramm angegeben ist, ändert sich der Wert dieses Koeffizienten auch dann nicht.
  • Der Korrelationskoeffizient zwischen den Variablen ist symmetrisch, was bedeutet, dass der Wert des Korrelationskoeffizienten zwischen Y und X oder X und Y gleich bleibt.

Fazit

Der Pearson-Korrelationskoeffizient ist die Art des Korrelationskoeffizienten, der die Beziehung zwischen den beiden Variablen darstellt, die auf demselben Intervall oder derselben Verhältnisskala gemessen werden. Es misst die Stärke der Beziehung zwischen den beiden kontinuierlichen Variablen.

Es gibt nicht nur das Vorhandensein oder Fehlen der Korrelation zwischen den beiden Variablen an, sondern bestimmt auch das genaue Ausmaß, in dem diese Variablen korreliert sind. Sie ist unabhängig von der Maßeinheit der Variablen, bei der die Werte des Korrelationskoeffizienten vom Wert +1 bis zum Wert -1 reichen können. Es reicht jedoch nicht aus, den Unterschied zwischen den abhängigen Variablen und den unabhängigen Variablen zu erkennen.

Interessante Beiträge...