Bereinigtes R zum Quadrat (Angepasstes Bestimmtheitsmaß)

Inhaltsverzeichnis:

Bereinigtes R zum Quadrat (Angepasstes Bestimmtheitsmaß)
Bereinigtes R zum Quadrat (Angepasstes Bestimmtheitsmaß)
Anonim

Das bereinigte R-Quadrat (oder das bereinigte Bestimmtheitsmaß) wird bei der multiplen Regression verwendet, um den Intensitätsgrad oder die Wirksamkeit der unabhängigen Variablen bei der Erklärung der abhängigen Variablen zu ermitteln.

In einfacheren Worten sagt uns das angepasste R-Quadrat, welcher Prozentsatz der Variation der abhängigen Variablen gemeinsam durch alle unabhängigen Variablen erklärt wird.

Die Verwendung dieses Koeffizienten ist dadurch gerechtfertigt, dass das unbereinigte Bestimmtheitsmaß tendenziell ansteigt, wenn wir Variablen zu einer Regression hinzufügen. Auch wenn der marginale Beitrag jeder der neu hinzugekommenen Variablen keine statistische Relevanz hat.

Daher könnte durch Hinzufügen von Variablen zum Modell das Bestimmtheitsmaß ansteigen, und wir könnten fälschlicherweise annehmen, dass der gewählte Satz von Variablen einen größeren Teil der Variation der unabhängigen Variablen erklären kann. Dieses Problem wird allgemein als „Modellüberschätzung“ bezeichnet.

VariationskoeffizientRegressionsanalyse

Bereinigte Bestimmtheitsmaßformeln

Um das oben beschriebene Problem zu lösen, schlagen viele Forscher vor, das Bestimmtheitsmaß mit der folgenden Formel anzupassen:

R2 zu → Bereinigtes R zum Quadrat oder angepasstes Bestimmtheitsmaß

R2 → R zum Quadrat oder Bestimmtheitsmaß

nein → Anzahl Beobachtungen in der Stichprobe

k → Anzahl unabhängiger Variablen

In Anbetracht dessen, dass 1-R2 eine konstante Zahl ist und da n größer als k ist, wird der Quotient in Klammern größer, wenn wir dem Modell Variablen hinzufügen. Folglich. auch das Ergebnis der Multiplikation mit 1-R2 . Damit sehen wir, dass die Formel so aufgebaut ist, dass die Einbeziehung von Koeffizienten in das Modell angepasst und bestraft wird.

Neben dem vorherigen Vorteil ermöglicht uns die in der vorherigen Formel verwendete Anpassung auch den Vergleich von Modellen mit unterschiedlicher Anzahl unabhängiger Variablen. Auch hier passt die Formel die Anzahl der Variablen zwischen einem Modell an und ermöglicht uns einen homogenen Vergleich.

Zurück zur vorherigen Formel können wir ableiten, dass das angepasste Bestimmtheitsmaß immer kleiner oder gleich dem Koeffizienten von R . ist2. Im Gegensatz zum Bestimmtheitsmaß, das zwischen 0 und 1 schwankt, kann das angepasste Bestimmtheitsmaß aus 2 Gründen negativ sein:

  • Je näher k nähert sich n.
  • Je niedriger das Bestimmtheitsmaß.
Linearer Korrelationskoeffizient