Quartilabweichung - Was es ist, Definition und Konzept

Inhaltsverzeichnis:

Anonim

Die Quartilabweichung ist ein statistisches Maß für die Streuung, das den zentralen Wert des Interquartilbereichs zurückgibt und in schiefen Datensätzen verwendet wird.

Mit anderen Worten, die Quartilsabweichung soll den Median des Interquartilsabstands (IQR) berechnen und wird in Datensätzen mit etlichen Extremwerten verwendet.

Die Abkürzung für Quartilsabweichung ist DQ.

Interquartilsabstand

Der Interquartilabstand ist ein Maß für die Streuung eines Datensatzes, der im Allgemeinen im Boxplot verwendet wird. Mit anderen Worten, der Interquartilabstand ist die Differenz zwischen dem vorletzten und dem ersten Quartil einer im Boxplot verwendeten Verteilung.

IQR = Q3 - Q1

Der Vorteil der Verwendung des Interquartilbereichs besteht darin, dass die Quartilabweichung (DQ) berechnet werden kann, was ein sehr angemessenes Maß für die Streuung ist, wenn wir verzerrte Datensätze haben.

Quartilabweichungsformel

Die Quartilabweichung wird als Division des Interquartilabstands durch 2 berechnet.

DQ = (Q3 - Q1) / 2 = RIC / 2

Da wir nur die Streuung zwischen dem dritten und ersten Quartil berücksichtigen, ignorieren wir alle Daten außerhalb dieses Bereichs. Und deshalb sind alle Werte fast extrem. Wenn wir also den Interquartilabstand durch zwei teilen, erhalten wir den Medianwert der Streuung.

Beispiel für eine Quartilabweichung

Wir nehmen an, dass wir den Interquartilabstand und die Quartilsabweichung der Anzahl der Radfahrer berechnen möchten, die während des Jahres an unserem Haus vorbeifahren.

  1. Zuerst zählen wir die Radfahrer und sammeln die Informationen in einer Tabelle.
  1. Zweitens berechnen wir das erste und das dritte Quartil, um den Interquartilabstand zu erhalten.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Drittens berechnen wir die Quartilstreuung, indem wir einfach den Interquartilabstand durch zwei teilen.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Die Quartilspreizung für diesen Datensatz beträgt 175. Diese Zahl ist der zentrale Wert des Interquartilsabstands.

Es ist wichtig zu beachten, dass es sich bei den Daten für den Monat Juli um extreme Daten handelt, da sie um ein Vielfaches höher sind als alle anderen Daten. Wir könnten also sagen, dass dieser Datensatz in Bezug auf diesen Monat verzerrt ist. Dank der „Ignoranz“ der Quartilstreuung gegenüber Extremdaten ist das Ergebnis dieser Maßnahme sehr ähnlich, wenn im Juli nur 600 Radfahrer verkehrten. Wenn es im Juli nur 600 Radfahrer gäbe, würde die Quartilstreuung 162,5 betragen, sehr nahe bei 175, wenn man bedenkt, dass die Anzahl der Radfahrer in diesem Monat zehnmal geringer ist.