Dummy-Variable - Was ist das, Definition und Konzept

Inhaltsverzeichnis:

Dummy-Variable - Was ist das, Definition und Konzept
Dummy-Variable - Was ist das, Definition und Konzept
Anonim

Eine Dummy-Variable ist eine Variable, die verwendet wird, um qualitative Werte in einem Regressionsmodell zu erklären.

Regressionsmodelle versuchen, eine Variable durch andere zu erklären. Zum Beispiel das Gehalt einer Person basierend auf ihrem Alter, ihrer Ausbildung und ihrer Erfahrung. Diese Variablen können quantifiziert werden. Das Alter, die Ausbildung und die Erfahrung einer Person können in Anzahl von Jahren quantifiziert werden. Aber was passiert, wenn wir Variablen haben, die nicht quantifiziert werden können? Zum Beispiel Haarfarbe, Land, in dem Sie leben, oder Geschlecht. Die Lösung für dieses Problem liegt in den Dummy-Variablen. Sie sind Variablen, die normalerweise binäre Werte annehmen. Das heißt, Wert null oder eins.

Zum Beispiel ist die Variable Geschlecht, wie wir gesagt haben, eine qualitative Variable. Um es in ein Regressionsmodell aufzunehmen, müssen Sie eine Dummy-Variable erstellen. Wir nennen die Variable "Frau" so, dass:

Frau = 1 (wenn die Person eine Frau ist)

Frau = 0 (wenn die Person keine Frau ist, also ein Mann ist)

In diesem Fall gilt „Mann“ als Referenzkategorie oder Basisgruppe.

Es gibt zwei Arten von Dummy-Variablen. Zum einen gibt es die additiven Dummy-Variablen und zum anderen die multiplikativen Dummy-Variablen.

Regressionsanalyse

Additiv-Dummy-Variable

Eine additive Dummy-Variable sammelt eine feste Änderung. Diese Änderung betrifft nur den konstanten Term der Gleichung. Zum Beispiel ein Modell, das darauf abzielt, Löhne nach Geschlecht und Bildungsjahren zu erklären. Wir können die Gleichung nehmen als Referenz auf Männer (zweite Gleichung) oder als Referenz auf Frauen (erste Gleichung) setzen:

Die grafische Darstellung der Gleichungen wäre: Für den Fall, dass Männer höhere Gehälter haben, würde das Modell unter Verwendung einer additiven Dummy-Variablen wie das vorherige Bild dargestellt.

Wenn Frauen in Ihrem Fall höhere Gehälter als Männer hätten, würde das Modell unter Verwendung einer additiven Dummy-Variablen grafisch wie das vorherige Bild dargestellt.

Der quantitative Unterschied zwischen der blauen Linie (Männer) und der orangefarbenen Linie (Frauen) entspricht dem Wert der Variablen «Frauen" oder "Männer»Je nach gewähltem Modell. In diesem Fall der additiven Dummy-Variablen ist die Gehaltsdifferenz unabhängig vom Studienniveau. Mit anderen Worten, der Lohnunterschied hängt einzig und allein vom Geschlecht ab.

Multiplikative Dummy-Variable

Eine multiplikative Dummy-Variable erfasst eine Änderung der Steigung der Gleichungen für Männer und Frauen. Wenn wir mit dem vorherigen Beispiel fortfahren, haben wir:

Grafisch wäre eine mögliche Darstellung:

In diesem Fall würde uns das Modell zwei Dinge sagen. Erstens sind die Löhne der Frauen niedriger als die der Männer. Und zweitens, dass sich ein zusätzliches Ausbildungsjahr für Männer besser auszahlt als für Frauen. Wir wissen das, weil die Steigung der blauen Linie (Männer) größer ist als die Steigung der orangen Linie (Frauen).

Wenn Frauen ein zusätzliches Bildungsjahr besser bezahlt würden, wäre die Steigung der orangefarbenen Linie (Frauen) größer. Und die blaue Linie (Männer) wäre unten.

Statistische Variable