Relevante Variable weggelassen

Inhaltsverzeichnis

Das Weglassen einer relevanten Variablen ist die Nichteinbeziehung einer wichtigen erklärenden Variablen in eine Regression. Angesichts der Gauss-Markov-Annahmen würde diese Unterlassung zu Verzerrungen und Inkonsistenzen in unseren Schätzungen führen.

Mit anderen Worten, das Auslassen einer relevanten Variablen tritt auf, wenn wir sie in den Fehlerterm u einbeziehen, weil wir sie nicht berücksichtigen. Dadurch entsteht eine Korrelation zwischen der abhängigen Variablen und dem Fehlerterm u.

Mathematisch nehmen wir an, dass:

Cov (x, u) = 0

Wenn wir eine relevante Variable in den Fehlerterm einbeziehen oder, dann:

Cov (x, u) ≠ 0

Angesichts der Gauss-Markov-Annahmen gilt diese Korrelation:

(ρ (x, u) ≠ 0)

Es würde das nicht erfüllen:

E (u | x) = E (u) = 0

Das heißt, die Erwartung der an die erklärenden Fehler bedingten Fehler ist gleich der Fehlererwartung und ist ebenfalls null. Dies sind die Annahmen der Unvoreingenommenheit (strenge Exogenität + Nullmittelwert)

Wird die relevante Variable weggelassen, ist der OLS-Schätzer verzerrt und inkonsistent. Es verletzt also zwei der Schätzereigenschaften und führt dazu, dass unsere Schätzung falsch ist.

Theoretisches Beispiel

Wir nehmen an, dass wir die Anzahl der Saisonskifahrer (t) unter Berücksichtigung mehrerer Faktoren untersuchen möchten: den Preis der Skipässe (Skipässe) und die Anzahl der geöffneten Pisten (Pisten) und die Schneequalität (Schnee).

Modell 0

Wir gehen davon aus, dass die erklärenden Variablen (Skipässe, Pisten und Schnee) relevante Variablen für Modell 0 sind, da sie zum Bevölkerungsmodell gehören. Mit anderen Worten, die erklärenden Variablen unseres Modells 0 wirken sich teilweise auf die abhängige Variable Skifahrer im Bevölkerungsmodell aus. Dann haben sowohl im Populations- als auch im Stichprobenmodell (Modell 0) andere Koeffizienten als Null.

Interpretation

Eine Erhöhung der Schneequalität (Schnee) und der Anzahl offener Abfahrten (Spuren) führt zu einer Erhöhung der Schätzungen von β2 und β3. Dies spiegelt sich folglich in der Anzahl der Skifahrer (Skifahrer) wider.

Eine prozentuale Erhöhung der Skipasspreise führt zu einem Rückgang des β1/ 100 in der Anzahl der Skifahrer (Skifahrer)

Prozess

Wir behandeln die Schneevariable als eine aus dem Modell ausgelassene Variable. Dann:

Modell 1

Wir unterscheiden den Fehlerterm u von Modell 0 und den Fehlerterm v von Modell 1, weil der eine die relevante Variable Schnee nicht enthält und der andere schon.

In Modell 1 haben wir eine relevante Variable aus dem Modell weggelassen und in den Fehlerterm u eingeführt. Dies bedeutet, dass:

  • Cov (Schnee, v) ≠ 0 → ρ (Schnee, v) ≠ 0
  • E (v | Schnee) ≠ 0

Wenn wir die relevante Variable snow in unserem Modell 1 weglassen, werden wir bewirken, dass der OLS-Schätzer Verzerrungen und Inkonsistenzen darstellt. Unsere Schätzung der Anzahl der Saisonskifahrer wird also falsch sein. Unter Berücksichtigung unserer Modell-1-Schätzung kann das Skigebiet in ernsthafte finanzielle Schwierigkeiten geraten.