Kategoriale Variable - Was ist das, Definition und Konzept

Inhaltsverzeichnis:

Kategoriale Variable - Was ist das, Definition und Konzept
Kategoriale Variable - Was ist das, Definition und Konzept
Anonim

Eine kategoriale Variable ist eine Variable, die es ermöglicht, eine Reihe von Daten anhand von festen Werten zu klassifizieren, die einer bestimmten Qualität oder Kategorie zugeordnet sind.

Die kategoriale Variable klassifiziert im Gegensatz zu kardinalen oder stetigen Variablen (die numerische Berechnungen ermöglichen) Einzelpersonen oder Fälle. Sie nehmen normalerweise Werte an, die durch ganze Zahlen dargestellt werden, wie Eins oder Null, aber dies sind nur Darstellungen.

Im Beispiel werden wir es genauer sehen.

Unterschiede zwischen kategorialer und kontinuierlicher Variable

Es gibt einige Unterschiede zwischen der kategorialen Variablen und der kontinuierlichen oder kardinalen Variablen, die bekannt sein sollten. Sehen wir uns die relevantesten an.

  • Zunächst wird die kategoriale Variable zum Gruppieren und die kontinuierliche Variable zum Zählen verwendet. Mit anderen Worten, die erste ermöglicht die Bildung von Kategorien mit einer Reihe von Daten. Zum Beispiel Geschlecht oder Anzahl der Kinder. Die zweite gibt uns numerische Informationen. Zum Beispiel Alter.
  • Die Kardinalvariable erlaubt numerische Berechnungen, die anderen nicht. Auf diese Weise können wir bei ersteren die Mittelwerte oder Varianzen kennen, während bei den anderen nur einige Daten wie der Modus oder der Prozentsatz der Kategorien bekannt sind.
  • Die kategorialen sind sehr nützlich, um qualitative Informationen zu kennen, dh eine gewisse Qualität der Daten. Die kontinuierlichen liefern uns quantitative Daten, dh Mengen und Werte, die durch Zahlen dargestellt werden.

Statistische Techniken für kategoriale Variablen

Als Nächstes sehen wir uns die statistischen Techniken an, die bei kategorialen Variablen am häufigsten verwendet werden, und vergleichen sie mit denen stetiger oder kardinaler Variablen.

  • Beschreibende Statistik: Bei dieser Art von Variablen basieren die Analysen in der Regel unter anderem auf Balken- und Prozentdiagrammen. Kardinäle ermöglichen die Anwendung von Analysetechniken zur Berechnung von Positionsstatistiken wie Quantilen oder Streuungsstatistiken wie Varianzen.
  • Hypothesenkontrast: Im Kategorischen können die Ergebnisse mittels nichtparametrischer Hypothesentests extrapoliert werden. Die kontinuierlichen hingegen verwenden parametrische Kontraste, die ebenfalls abgeleitet werden können.
  • Regressionstechniken: In diesem Fall werden für ersteres unter anderem logistische Regression oder ähnliches verwendet. Für den anderen Variablentyp ist die am häufigsten verwendete Methode die lineare Regression.

Beispiel einer kategorialen Variablen

Schauen wir uns zum Abschluss ein sehr häufiges Beispiel im Marketing an. Stellen wir uns vor, wir wollen ein Produkt verkaufen und interessieren uns für den Familienstand.

Dazu weisen wir 1 Single, 2 verheiratet, 3 geschieden, 4 Partner und 5 anderen zu.

Sehen wir uns das Bild an und kommentieren wir es dann:

Darin können wir sehen, dass der höchste Prozentsatz der Personen ledig, verheiratet und geschieden ist, während die anderen beiden Optionen nur 5 % betragen.

Wie wir sehen, sind kategoriale Variablen für die Gruppierung nützlich. Das Balkendiagramm ermöglicht es uns, diese Prozentsätze besser zu beobachten, da es einfacher ist, die Größe der Balken zu vergleichen.