Formel zur Berechnung der Korrelation
Die Korrelation ist ein statistisches Maß zwischen zwei Variablen und wird als die Änderung der Menge in einer Variablen definiert, die der Änderung in einer anderen entspricht. Sie wird durch Summieren des Produkts aus der Summe der ersten Variablen minus dem Mittelwert der ersten Variablen in die Summe der zweiten Variablen minus berechnet der Mittelwert der zweiten Variablen geteilt durch das Ganze unter der Produktwurzel des Quadrats der ersten Variablen minus Mittelwert der ersten Variablen in die Summe des Quadrats der zweiten Variablen minus Mittelwert der zweiten Variablen.
Der Korrelationswert ist zwischen -1 und +1 begrenzt und kann wie folgt interpretiert werden:
- -1: Wenn es -1 ist, werden Variablen als perfekt negativ korreliert bezeichnet. Das heißt, wenn sich eine Variable in eine Richtung bewegt, bewegt sich eine andere in die entgegengesetzte Richtung.
- 0: Das heißt, die Variable hat keine Korrelation.
- +1: Wenn es +1 ist, werden Variablen als perfekt positiv korreliert bezeichnet. Beide Variablen bewegen sich in positive Richtungen.
Wenn wir 2 Variablen x und y haben, kann der Korrelationskoeffizient zwischen 2 Variablen wie folgt gefunden werden:
Korrelationskoeffizient = ∑ (x (i) - Mittelwert (x)) * (y (i) - Mittelwert (y)) / √ (∑ (x (i) - Mittelwert (x)) 2 * ∑ (y (i) -Mittel (y)) 2 )
Wo,
- x (i) = Wert von x in der Probe
- Mittelwert (x) = Mittelwert aller Werte von x
- y (i) = Wert von y in der Probe
- Mittelwert (y) = Mittelwert aller Werte von y
Beispiele
Es ist mühelos, die Korrelation in Excel zu berechnen. Die Syntax der verwendeten Funktion lautet wie folgt:
Korrelationskoeffizient = CORREL (Array1, Array2)
Beispiel 1
Nehmen wir das gleiche Beispiel, das wir oben für die Berechnung der Korrelation mit Excel genommen haben.
Lösung:
Unten sind die Werte von x und y:

Die Berechnung ist wie folgt.

Basis-Excel-Formel = CORREL (Array (x), Array (y))

Koeffizient = +0,95
Da dieser Koeffizient nahe bei +1 liegt, sind x und y stark positiv korreliert.
Beispiel 2
Die Korrelation ist hauptsächlich nützlich, um den Aktienkurs von Unternehmen zu analysieren und darauf basierend ein Aktienportfolio zu erstellen.
Lassen Sie uns die Korrelation der Apple-Aktie mit dem Nasdaq-Index anhand der Aktienperformance des letzten Jahres herausfinden. Apple ist ein in den USA ansässiges multinationales Unternehmen, das sich auf IT-Produkte wie iPod, iPad, Mac usw. spezialisiert hat.
Lösung:
Nachfolgend finden Sie die monatliche Rendite der Apple- und Nasdaq-Aktien für das letzte Jahr:

Lassen Sie uns nun die Werte eingeben -
Korrelationskoeffizient = ∑ (x (i) - Mittelwert (x)). (Y (i) - Mittelwert (y)) / √ ∑ (x (i) - Mittelwert (x)) 2 ∑ (y (i) - Mittelwert (y)) 2

Korrelation zwischen Apple und Nasdaq = 0,039 / (√ 0,0000)

Koeffizient = 0,62
Da die Korrelation zwischen Apple und Nasdaq positiv ist, ist Apple positiv mit Nasdaq korreliert.
Beispiel 3
Betrachten wir nun die Korrelation zwischen Walmart und Nasdaq-Index basierend auf der letzten einjährigen Aktienperformance. Walmart ist ein US-amerikanisches Unternehmen mit einer Supermarktkette.
Lösung:
Nachfolgend finden Sie die monatliche Performance zwischen Walmart und Nasdaq für das letzte Jahr.

Lassen Sie uns nun die Werte in die Formel eingeben -
Korrelationskoeffizient = ∑ (x (i) - Mittelwert (x)). (Y (i) - Mittelwert (y)) / √ ∑ (x (i) - Mittelwert (x)) 2 ∑ (y (i) - Mittelwert (y)) 2
Daher ist die Berechnung wie folgt:

Korrelation zwischen Walmart und Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Koeffizient = 0,12
Wir können sehen, dass Walmart und Nasdaq ebenfalls positiv korreliert sind, jedoch nicht so stark wie die Apple-Korrelation mit Nasdaq.
Relevanz und Verwendung
Ein Korrelationskoeffizient ist nützlich, um die lineare Beziehung zwischen zwei Variablen herzustellen. Es misst, wie sich eine Variable im Vergleich zur Bewegung einer anderen Variablen bewegt. Die praktische Verwendung dieses Koeffizienten besteht darin, die Beziehung zwischen der Aktienkursbewegung und der Gesamtmarktbewegung herauszufinden. Auf der Grundlage dieser Analyse wird ein Aktienanalyst den Anteil der Aktien einbeziehen, um ein optimales Portfolio mit minimalem Risiko zu erstellen. In der Datenwissenschaft ist es auch nützlich, die Beziehung zwischen zwei Variablen herauszufinden.
Der Korrelationskoeffizient wird auch sehr häufig zur Untersuchung der Konstruktvalidität von Daten in der Faktoranalyse verwendet. Es wird häufig in der Regressionsanalyse verwendet, um die Werte abhängiger Variablen basierend auf der Beziehung zwischen abhängigen und unabhängigen Variablen vorherzusagen. Diese Gleichung ist bei der quantitativen Analyse sehr nützlich, um die Art der Beziehung zwischen verschiedenen Variablen zu ermitteln. Die Grundlage dieser Beziehung: Wenn eine Variable nicht mit anderen Variablen in Beziehung steht, kann sie aus der Liste entfernt werden.