Kendalls Tau (I) - Was es ist, Definition und Konzept

Inhaltsverzeichnis:

Kendalls Tau (I) - Was es ist, Definition und Konzept
Kendalls Tau (I) - Was es ist, Definition und Konzept
Anonim

Es ist ein nicht parametrisches Abhängigkeitsmaß, das die konkordanten und diskordanten Paare zweier Variablen identifiziert. Nach der Identifizierung werden die Summen berechnet und der Quotient gebildet.

Klassifizierte Korrelationen sind eine nichtparametrische Alternative als Maß für die Abhängigkeit zwischen zwei Variablen, wenn wir den Korrelationskoeffizienten von Pearson nicht anwenden können.

Mit anderen Worten, wir weisen den Beobachtungen jeder Variablen eine Rangfolge zu und untersuchen die Abhängigkeitsbeziehung zwischen zwei gegebenen Variablen. Es gibt zwei Möglichkeiten, Kendalls Tau zu berechnen; Wir entscheiden uns, die Abhängigkeitsbeziehung zu berechnen, sobald die Beobachtungen jeder Variablen geordnet sind. In unserem Beispiel sehen wir, dass wir die Ranglisten in Spalte X aufsteigend sortiert haben.

Mathematisch,

Wir definieren:

Cnein = Gesamtzahl übereinstimmender Paare.

NCnein = Gesamtzahl nicht übereinstimmender (diskordanter) Paare.

Vorgehensweise und Praxisbeispiel

Um Kendalls Tau zu erhalten, müssen wir zunächst wissen, wie man die konkordanten und diskordanten Paare zweier Variablen identifiziert.

Wir werden die Vorlieben der Skifahrer nutzen. In diesem Beispiel gehen wir davon aus, dass wir auswerten wollen, ob die Skifahrer ihre Vorlieben für den alpinen Skilauf oder den nordischen Skilauf in einer Station i in gleicher Reihenfolge einordnen. Ihre Bewertungen können von 1 (sehr bevorzugt) bis 7 (sehr wenig bevorzugt) reichen.

Unsere Frage wäre: Gibt es in den jeweiligen Skigebieten eine Abhängigkeit zwischen den Vorlieben von Abfahrtsläufern und Langläufern?

Wir definieren:

X = Wertung der Skifahrer für Ski Alpin in Station i.

Y = Einschätzung der Skifahrer für den Nordischen Skilauf an der Station i.

C = übereinstimmende Paare.

NC = nicht übereinstimmende / nicht übereinstimmende Paare.

UNDich = Skigebiet i.

Prozess

  • Wir beginnen mit einer Probe von n = 7 Beobachtungen von Skigebieten. Jede Zeile der Tabelle sind Klassifizierungen der Skifahrer. Jedes Stationspaar kann konkordant oder diskordant sein. In den Spalten C und NC zählen wir die Paare nur in eine Richtung. Zum Beispiel werden das Paar AB und BA als einzelnes Paar gezählt, um Wiederholungen zu vermeiden.

Die erhaltenen Beobachtungen sind:

Skigebiet (ich) X Z
ZU 1 1
B 2 3
C 3 4
D 4 2
UND 5 7
F 6 6
G 7 5
  1. Wir haben die Elemente der Spalte X aufsteigend sortiert, um sie mit den Elementen der Spalte Z vergleichen zu können
  2. Wir finden die konkordanten Paare und die diskordanten Paare.
Skigebiet (ich) X Z CNC
ZU 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
UND 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Gesamt
  • Zuerst betrachten wir Spalte Z, da Spalte X bereits aufsteigend sortiert ist. Folglich sind alle Klassifikationen in Spalte Z, die nicht aufsteigend sind, diskordante Stationspaare.
    • Wenn wir nach Paaren von Stationen (konkordant und nicht-konkordant) suchen, haben wir immer die letzte Reihe von Beobachtungen, weil wir nach Paaren (Sätzen von zwei Beobachtungen) suchen.
    • Alle diejenigen, die unterhalb einer Referenzklassifikation liegen, sind konkordante Paare. Im ersten Fall legen beide Skifahrer diese Referenzklassifizierung mit 1 fest. Alle Klassifikationen unter 1 sind Paare, die mit A übereinstimmen. Insgesamt haben wir 7 Stationen zu klassifizieren. Es gibt also 6 konkordante Paare von A. Da wir keine diskordanten Paare haben, die mit A verbunden sind, werden wir eine Null setzen.

Lesen Sie den zweiten Teil von Kendalls Tau (II)