Einfache Autokorrelationsfunktion - Beispiel in R

Inhaltsverzeichnis:

Einfache Autokorrelationsfunktion - Beispiel in R
Einfache Autokorrelationsfunktion - Beispiel in R
Anonim

Mit anderen Worten, die Simple Autocorrelation Function (FAS), oder aus dem Englischen, Autokorrelationsfunktion, Es ist eine mathematische Funktion, die uns hilft zu wissen, wie abhängig die Daten einer bestimmten Periode von den gleichen Daten aus k vorherigen Perioden sind.

Wir generieren eine jährliche Zeitreihe X, die einer Normalverteilung plus einer Trägheit folgt. Wir können auch echte Daten verwenden.

Methodik

Programme sind für die Arbeit an der Autokorrelationsanalyse unerlässlich. Programme wie Python können verwendet werden, aber für statistische Analysen und Datenverwaltung empfehlen wir R oder seine verbesserte Version R Studio. Hier arbeiten wir mit R.

Berechnung

Und wie schreiben wir die FAS-Formel in R-Code?

Sowohl R als auch Python haben Bibliotheken, in denen Formeln mit einem Namen verknüpft sind. Dann reicht es, dass wir die Bibliothek installiert haben, die die Formel enthält, die wir verwenden möchten, und sie im Skript aufrufen.

Im Quion von R müssen wir schreiben:

Die Funktion acf es ist in der Bibliothek Statistiken.

X -> Zeitreihen, die wir als Beispiel für die Berechnung des FAS verwenden.

acf (X, ylim = c (-1,1)) -> Einfache Autokorrelationsfunktion auf X mit Grenzen auf der vertikalen Achse zwischen -1 und 1, das sind die Werte, die der Autokorrelationskoeffizient annehmen kann.

Überprüfung

Dieser Schritt ist nicht erforderlich, wenn wir den vorherigen Code verwendet haben, da er die Konfidenzbänder selbst berechnet.

Um zu bestimmen, ob die berechneten Autokorrelationskoeffizienten statistisch signifikant sind, müssen wir Konfidenzbänder mit den kritischen Werten erstellen. Auf diese Weise können wir anhand eines Signifikanzprozentsatzes mit statistischer Sicherheit sagen, ob eine Autokorrelation in den Daten vorliegt oder nicht.

Ebenso wie der Korrelationskoeffizient nimmt auch der Autokorrelationskoeffizient Normalität an und wir berechnen daher das Konfidenzintervall wie folgt:

Wir definieren Hypothesentests als:

Bei 95 % Konfidenz mit einem Signifikanzniveau von 5 % finden wir in den Normaltabellen die berühmte 1,96. Kritischer Wert wird gegeben durch:

Wobei die Varianz der Koeffizienten durch die Näherung gegeben ist:

Obwohl wir die Formel angeben, empfehlen wir, statistische Programme für mehr Präzision und Geschwindigkeit zu verwenden.

Ergebnis

Alle Linien, die außerhalb des Konfidenzbandes enden, bedeuten, dass die Zeitreihe im angegebenen Zeitraum Autokorrelation aufweist.

Basierend auf dem Diagramm sehen wir also, dass in dieser Zeitreihe in den Perioden, in denen die Linie aus dem diskontinuierlichen Band hervorsteht, Autokorrelation vorhanden ist.

Die erste Zeile, die auf 0 steht und in Richtung 1 feuert, kann ignoriert werden, da t unbedingt größer als 0 sein muss und in diesem Fall nicht. Es macht wenig Sinn, alle vorherigen Schritte durchführen zu müssen, um die Autokorrelation von jetzt mit jetzt zu kennen, denn wir wissen es bereits: Die Korrelation einer Variablen mit sich selbst ist 1, also haben wir bereits die Antwort.