Es ist ein nicht parametrisches Abhängigkeitsmaß, das die konkordanten und diskordanten Paare zweier Variablen identifiziert. Nach der Identifizierung werden die Summen berechnet und der Quotient gebildet.
Mit anderen Worten, wir weisen den Beobachtungen jeder Variablen eine Rangfolge zu und untersuchen die Abhängigkeitsbeziehung zwischen zwei gegebenen Variablen.
Es gibt zwei Möglichkeiten, Kendalls Tau zu berechnen; Wir entscheiden uns, die Abhängigkeitsbeziehung zu berechnen, sobald die Beobachtungen jeder Variablen geordnet sind. In unserem Beispiel sehen wir, dass wir die Rankings in Spalte X aufsteigend sortieren.
Klassifizierte Korrelationen sind eine nichtparametrische Alternative als Maß für die Abhängigkeit zwischen zwei Variablen, wenn wir den Korrelationskoeffizienten von Pearson nicht anwenden können.
Dies sind die Ergebnisse, auf die wir im ersten Artikel verwiesen haben -> Kendall's Tau (I):
Skigebiet (ich) | X | Z | C | NC | |
ZU | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
UND | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
G | 7 | 5 | 43 | 3 | GESAMT |
- Das BC-CB-Paar ist ein diskordantes Paar. Wir tragen 1 in die Spalte NC ein und frieren den Zähler an der letzten Stelle ein, bis wir wieder ein passendes Paar finden. In diesem Fall haben wir die Anzahl der passenden Paare auf 5 bis Station D eingefroren. Station D kann nur 4 passende Paare bilden: AD-DA, DE-ED, DF-FD, DG-GD.
Ein weiteres nicht übereinstimmendes Paar wäre EF-FE:
- Das EF-FE-Paar ist ein diskordantes Paar. Wir schreiben 1 in die NC-Spalte und ziehen die Zahl 4 der konkordanten Paare, die gebildet werden können, weiter. Die passenden Paare von Station E wären: EA-AE, EB-BE, EC-CE, ED-DE, da EF-FE nicht übereinstimmend ist.
- Das FG-GF-Paar ist ein diskordantes Paar. Wir schreiben 1 in die NC-Spalte und ziehen die Zahl 4 der konkordanten Paare, die gebildet werden können, weiter. Die konkordanten Paare der Station F s (wir haben die statt 4 nicht variiert. Die konkordanten Paare, die wir vorher zeigen konnten (wir haben die nicht variiert wären: FA-AF, FB-BF, FC-CF, FD-DF weil FG-GF erschüttert.
Wir berechnen Kendalls Tau
Kendalls Tau hat kein Geheimnis, außer dem Quotienten der übereinstimmenden und nicht übereinstimmenden Paare einer Stichprobe von Beobachtungen.
Interpretation
Unsere Ausgangsfrage war: Gibt es in bestimmten Skigebieten eine Abhängigkeitsbeziehung zwischen den Vorlieben von Abfahrtsläufern und Langläufern?
In diesem Fall haben wir eine Abhängigkeit zwischen den beiden Variablen von 0,8695. Ein Ergebnis sehr nahe an der Obergrenze. Dieses Ergebnis sagt uns, dass Ski Alpin (X) und Langläufer (Z) die Skigebiete mit ähnlichen Klassifizierungen klassifiziert haben.
Ohne irgendwelche Berechnungen durchführen zu müssen, können wir sehen, dass die ersten Stationen (A, B, C) die besten Ergebnisse von den beiden Gruppen erhalten. Mit anderen Worten, die Bewertungen der Skifahrer folgen der gleichen Richtung.
Vergleich: Pearson vs Kendall
Wenn wir den Korrelationskoeffizienten von Pearson aus den vorherigen Beobachtungen berechnen und mit Kendalls Tau vergleichen, erhalten wir:
In diesem Fall sagt uns Kendalls Tau, dass es eine stärkere Abhängigkeitsbeziehung zwischen den Variablen X und Z im Vergleich zum Korrelationskoeffizienten von Pearson gibt: 0,8695 > 0,75.
Wenn die Ausreißer einen großen Einfluss auf die Ergebnisse hätten, würden wir einen großen Unterschied zwischen Pearson und Spearman feststellen und sollten daher Spearman als Maß für die Abhängigkeit verwenden.