Boxplot - Was ist das, Definition und Konzept

Inhaltsverzeichnis:

Anonim

Ein Boxplot, aus dem Englischen, Boxplot, ist eine Darstellung einer quantitativen oder kategorialen Variablen, um die Quartile des Datensatzes schnell zu identifizieren.

Mit anderen Worten, ein Boxplot ist ein Diagramm, das eine quantitative oder qualitative Variable durch die Quartile darstellt.

In der Statistik ist es ein nützliches Werkzeug, um sowohl diskrete als auch kontinuierliche Datensätze darzustellen.

Es ist wichtig zu beachten, dass die qualitativen Variablenvariablen oder die eine Ordnung oder Kategorie darstellen sollen, immer mit einem numerischen Index größer 0 verknüpft sein müssen, damit sie in der Grafik erscheinen und die entsprechende Statistik berechnet werden kann.

Boxplot und Histogramm

Ein Boxplot ist nichts anderes als ein von oben betrachtetes Histogramm, und ebenso ist ein Histogramm ein Boxplot von der Seite betrachtet. Ein Beispiel ist unten zu sehen.

Das erste gemeinsame Merkmal beider Diagramme ist das Minimum und das Maximum des Datensatzes. Die Endbalken nach den Strichen geben das Minimum (unterer Balken) und Maximum (oberer Balken) an. Ausreißer würden außerhalb des Bereichs von Maximum und Minimum dargestellt. Das heißt, über die Balken nach den Bindestrichen hinaus. Wir können auch horizontale Boxplots finden.

Auf einen Blick können Sie sehen, dass die meisten Daten in beiden Grafiken auf die Beobachtungen nahe dem Minimum zentriert sind. Dies wird durch den Boxplot angezeigt, bei dem die Box näher am Minimum als am Maximum liegt. Wenn wir uns das Histogramm ansehen, sehen wir, dass die häufigsten Beobachtungen die Beobachtungen sind, die nahe am Minimum und weit vom Maximum entfernt sind.

Informationen zum Boxplot

Die Informationen des Boxplots lauten wie folgt:

  1. Der unterste Teil der Box ist das erste Quartil (Q1).
  2. Der Balken in der Mitte der Box ist der Median oder das zweite Quartil (Q2).
  3. Der obere Teil der Box ist das dritte Quartil (Q3).
  4. Der Interquartilabstand oder IQR wäre die Höhe der Box, also die Differenz zwischen Q3 und Q1.

Boxplot-Schlüssel

Diese grafische Darstellung wird Boxplot genannt, weil sie wie eine Box aussieht. Um sich diesen Graphen zu merken, müssten wir uns daher nur an ein quadratisches Objekt oder eine Box denken.

Leser, die mit dem Preis von Finanzanlagen vertraut sind, werden mehr Ähnlichkeit mit einer Kerze sehen. Die Kerzen, die Sie im Zitat sehen, sind Boxplots, die an das gewählte Zeitfenster angepasst sind.

Vor- und Nachteile des Boxplots

Unter den Vor- und Nachteilen dieses Diagramms finden wir Folgendes:

Vorteil

  • Globalisierte Vision der absoluten Häufigkeit einer quantitativen oder qualitativen Variablen.
  • Kenntnis des Minimums, Maximums und Quartils des Datensatzes, ohne diese berechnen zu müssen.
  • Erkennen von Extremwerten schneller als bei einem Histogramm, da Extremwerte mit Kreisen außerhalb des Maximums und Minimums angezeigt werden.

Nachteile

  • Wenn der Datensatz klein ist, erschwert die Erstellung eines Boxplots zur Darstellung dieser Daten das Verständnis.

Boxplot-Beispiel

Wir nehmen an, dass wir die Anzahl der Radfahrer darstellen möchten, die im Laufe eines Jahres an unserem Haus vorbeifahren. Zuerst zählen wir die Radfahrer und sammeln die Informationen in einer Tabelle.

Durch einige Programme wie R oder Excel können wir die unten gezeigte Grafik generieren.

Dank der Darstellung der Anzahl der Radfahrer im Boxplot können wir schnell erkennen, wo der Median, die anderen Quartile, das Maximum und das Minimum liegen. In diesem Fall haben wir keine atypischen Daten, da jenseits des Maximums und Minimums nichts ist.

Die Anwendung dieses Diagrammtyps ist aufgrund seiner Einfachheit und Nützlichkeit in vielen Bereichen jenseits der Finanz- und Wirtschaftswissenschaften sehr verbreitet.