Bayessches Informationskriterium

Das Bayessche Informationskriterium oder Schwarz-Kriterium ist eine Methode, die sich auf die Summe der Quadrate der Residuen konzentriert, um die Anzahl der verzögerten Perioden zu finden p die dieses Modell minimieren.

Mit anderen Worten, wir möchten die minimale Anzahl verzögerter Perioden finden, die wir in die Autoregression einschließen, um uns bei der Vorhersage der abhängigen Variablen zu helfen.

Auf diese Weise haben wir die Kontrolle über die Anzahl der verzögerten Perioden p die wir in die Regression einbeziehen. Wenn wir dieses optimale Niveau überschreiten, wird das Schwarz-Modell aufhören zu sinken und daher haben wir das Minimum erreicht. Das heißt, wir haben die Anzahl der verzögerten Perioden erreicht p die das Schwarz-Modell minimieren.

Es wird auch als Bayes-Informationskriterium (BIC) bezeichnet.

Empfohlene Artikel: Autoregression, Summe der Quadrate von Residuen (SCE).

Bayessche Informationskriteriumsformel

Obwohl es auf den ersten Blick wie eine komplizierte Formel erscheint, werden wir Teile durchgehen, um sie zu verstehen. Zunächst einmal müssen wir ganz allgemein:

  • Die Logarithmen in beiden Faktoren der Formel repräsentieren den marginalen Effekt der Einbeziehung einer verzögerten Periode p mehr in Selbstregression.
  • N ist die Gesamtzahl der Beobachtungen.
  • Wir können die Formel in zwei Teile unterteilen: den linken Teil und den rechten Teil.

Der linke Teil:

Stellt die Summe der Quadrate der Residuen (SCE) der Autoregression von darp verzögerte Zeiträume, geteilt durch die Gesamtzahl der Beobachtungen (N).

Zur Schätzung der Koeffizienten verwenden wir gewöhnliche kleinste Quadrate (OLS). Wenn wir also neue verzögerte Perioden einbeziehen, kann der SCE (p) nur beibehalten oder verringert werden.

Dann bewirkt die Zunahme einer verzögerten Periode in der Autoregression:

  • SCE (p): nimmt ab oder bleibt konstant.
  • Bestimmungskoeffizient: steigt.
  • GESAMTEFFEKT: Eine Zunahme in einer verzögerten Periode verursacht eine Abnahme im linken Teil der Formel.

Jetzt der richtige Teil:

(p + 1) stellt die Gesamtzahl der Koeffizienten in der Autoregression dar, d. h. die Regressoren mit ihren verzögerten Perioden (p) und das Abfangen (1).

Dann bewirkt die Zunahme einer verzögerten Periode in der Autoregression:

  • (p + 1): steigt, weil wir eine verzögerte Periode einbeziehen.
  • GESAMTEFFEKT: Eine Zunahme in einer verzögerten Periode verursacht eine Zunahme im rechten Teil der Formel.

Praxisbeispiel

Wir nehmen an, dass wir eine Vorhersage über die Preise derSkipässe für die nächste Saison 2020 mit einer 5-Jahres-Stichprobe, aber wir wissen nicht, wie viele Verzögerungsperioden verwendet werden sollen: AR (2) oder AR (3)?

  • Wir laden die Daten herunter und berechnen die natürlichen Logarithmen der Preise der Skipässe.

1. Wir schätzen die Koeffizienten mit OLS und erhalten:

Summe der Quadrate der Residuen (SCE) für AR (2) = 0,011753112

Bestimmtheitsmaß für AR (2) = 0,085

2. Wir fügen eine weitere verzögerte Periode hinzu, um zu sehen, wie sich die SCE ändert:

Summe der Quadrate der Residuen für AR (3) = 0,006805295

Bestimmtheitsmaß für AR (3) = 0,47

Wir können sehen, dass, wenn wir eine verzögerte Periode in der Autoregression hinzufügen, das Bestimmtheitsmaß in diesem Fall zunimmt und der SCE abnimmt.

  • Wir berechnen das Bayessche Informationskriterium:

Je kleiner das BIC-Modell ist, desto bevorzugter ist das Modell. Dann wäre AR (3) das bevorzugte Modell gegenüber AR (2), da sein Bestimmtheitsmaß höher, der SCE niedriger und das Schwarz-Modell oder das Bayes'sche Informationskriterium ebenfalls niedriger ist.