Spearman's Rho - Was ist das, Definition und Konzept

Inhaltsverzeichnis:

Anonim

Spearmans Rho ist ein nicht-parametrisches Abhängigkeitsmaß, bei dem die mittlere Hierarchie der Beobachtungen berechnet, die Differenzen quadriert und in die Formel aufgenommen werden.

Mit anderen Worten, wir weisen den Beobachtungen jeder Variablen eine Rangfolge zu und untersuchen die Abhängigkeitsbeziehung zwischen zwei gegebenen Variablen.

Klassifizierte Korrelationen sind eine nichtparametrische Alternative als Maß für die Abhängigkeit zwischen zwei Variablen, wenn wir den Korrelationskoeffizienten von Pearson nicht anwenden können.

Generell wird der Buchstabe giega zugeordnet rho zum Korrelationskoeffizienten.

Die Rho-Schätzung von Spearman ist gegeben durch:

Rho Spearman-Verfahren

0. Wir beginnen mit einer Stichprobe von nein Beobachtungen (Aich, Bich).

1. Klassifizieren Sie die Beobachtungen jeder Variablen und bereinigen Sie sie nach Gleichständen.

  • Wir verwenden eine Excel-Funktion, die die Beobachtungen für uns klassifiziert und automatisch anpasst, wenn sie Verbindungen zwischen den Elementen findet. Diese Funktion heißt HERARCH.MEDIA (Klassifizierung Aich; Eine Klassifizierungnein;Auftrag).
  • Der letzte Faktor der Funktion ist optional und sagt uns, in welcher Reihenfolge wir die Beobachtungen anordnen wollen. Eine Zahl ungleich Null sortiert die Beobachtungen in aufsteigender Reihenfolge. Zum Beispiel weist es dem kleinsten Element den Rang 1 zu. Wenn wir eine Null in die Variable setzen Auftrag, weist dem größten Artikel den Rang 1 zu (absteigende Reihenfolge).

Praxisbeispiel

  • In unserem Fall weisen wir der Ordnungsvariablen eine Zahl ungleich Null zu, um die Beobachtungen in aufsteigender Reihenfolge zu ordnen. Das heißt, dem kleinsten Element der Variablen wird der Rang 1 zugewiesen.
  • Wir prüfen, ob die Gesamtsummen der Spalten von Klassifizierung A Ja Klassifizierung B sie sind einander gleich und treffen sich:

In diesem Fall n = 10, weil wir in jeder Variablen insgesamt 10 Elemente / Beobachtungen haben ZU Ja B.

Die Gesamtsumme der Klassifikation A ist gleich der Gesamtsumme der Klassifikation Y und sie erfüllen auch die obige Formel.

ZU B Klassifizierung A Klassifizierung B Quadratische Differenzen
0 50 2,5 8,5 36
70 -20 9 3 36
-20 30 1 6,5 30,25
40 -90 6 1 25
30 0 5 4 1
50 30 7 6,5 0,25
20 20 4 5 1
0 -40 2,5 2 0,25
80 70 10 10 0
60 50 8 8,5 0,25
Gesamt 55 55 130

2. Addieren Sie die Unterschiede zwischen den Rankings und quadrieren Sie sie.

  • Sobald wir alle klassifizierten Beobachtungen unter Berücksichtigung der Verbindungen zwischen ihnen haben, berechnen wir die Differenz in der Form:

dich = Aich - Bich

Wir definieren (dich) als Differenz zwischen der Klassifizierung von Aich und die Klassifizierung von Bich.

  • Sobald die Differenz ermittelt ist, quadrieren wir sie. Die Quadrate der Differenzen haben nur positive Werte.

Wir definieren dich2 als quadrierte Differenz zwischen der Klassifikation von Aich und die Klassifizierung von Bich.

In der Spalte der quadrierten Differenzen haben wir:

dich2 = (Aich - Bich)2

3. Berechne Spearmans Rho:

  • Wir berechnen die Gesamtsumme der quadrierten Differenzen der Form:

In unserem Beispiel:

  • Wir integrieren das Ergebnis in die Rho-Formel von Spearman:

In unserem Beispiel:

Vergleich: Pearson vs. Spearman

Wenn wir den Korrelationskoeffizienten von Pearson anhand der vorherigen Beobachtungen berechnen und mit dem Korrelationskoeffizienten von Spearman vergleichen, erhalten wir:

  • Pearson = 0,1109
  • Speerkämpfer = 0,2121

Wir können sehen, dass die Abhängigkeit zwischen den Variablen A und B auch bei Verwendung von Spearman anstelle von Pearson schwach bleibt.

Wenn die Ausreißer einen großen Einfluss auf die Ergebnisse hätten, würden wir einen großen Unterschied zwischen Pearson und Spearman feststellen und sollten daher Spearman als Maß für die Abhängigkeit verwenden.