Ausreichende Statistik - Was es ist, Definition und Konzept

Inhaltsverzeichnis:

Anonim

Eine ausreichende Statistik für einen Parameter Θ ist eine Statistik, die in der Lage ist, alle Informationen zu sammeln oder zusammenzufassen, die die Stichprobe einer Zufallsvariablen X enthält.

Wir wissen, dass eine Statistik eine reale Funktion der Stichprobe ist. Das heißt, es werden reale Werte verwendet, die in der Stichprobe enthalten sind. Von da an müssen wir, wie wir in dem Artikel gesehen haben, in dem der Begriff der Statistik definiert wird, sicherstellen, dass der Statistiker bestimmte Eigenschaften hat. Warum solche Eigenschaften verlangen? Um sicherzustellen, dass die Statistik für unsere Zwecke nützlich ist.

Suffizienz ist eine dieser Eigenschaften. Viel einfacher sagen wir, dass eine Statistik ausreicht, wenn sie alle in der Stichprobe enthaltenen Informationen verwendet.

Wie erkennt man, ob eine Statistik ausreicht?

Logischerweise stellt sich die Frage: Wie kann ich wissen, ob eine T-Statistik die Suffizienzeigenschaft erfüllt? Oder wie kann ich, falls vorhanden, eine Statistik finden, die die Suffizienzeigenschaft erfüllt. Die Antwort auf diese beiden Fragen findet sich in zwei Sätzen:

  • Fisher-Neyman-Faktorisierungskriterium: Dieses Kriterium besagt, dass eine gegebene Statistik T, wenn sie bestimmte Bedingungen erfüllt, eine ausreichende Statistik ist.
  • Darmois-Theorem: Dieser Satz beantwortet die zweite Frage. Das heißt, es ermöglicht uns, durch eine Reihe von Verfahren eine ausreichende Statistik zu finden.

Beispiel für eine ausreichende Statistik

Angenommen, wir möchten das durchschnittliche Jahreseinkommen von Familien mit Wohnsitz in Chile berechnen. Dazu gehen wir wie folgt vor:

  1. Informationen sammeln (Beispiel): Da wir nicht jede einzelne der in Chile lebenden Familien fragen können, wie viel sie jährlich verdienen, nehmen wir eine repräsentative Stichprobe von beispielsweise 1.000 Familien.
  2. Identifizieren Sie die zu untersuchende Zufallsvariable: Die untersuchte Zufallsvariable ist das Familieneinkommen. Also: X → Familieneinkommen
  3. Wählen Sie die richtige Statistik: Die geeignete Statistik zur Berechnung des Durchschnittseinkommens ist keine andere als die Erwartung von X. Mit anderen Worten, der Stichprobenmittelwert von X.
  4. Wie kann ich wissen, ob die Stichprobenmittelwertstatistik eine ausreichende Statistik ist? Da wir bereits den mathematischen Ausdruck der Statistik haben, verwenden wir das Faktorisierungskriterium Fisher-Neyman. Oder das Darmois-Theorem. Es sind Formeln, die zu diesem Zweck erstellt wurden.

Nach Anwendung der richtigen Berechnungen kommen wir zu dem Schluss, dass die Stichprobenmittelwertstatistik die Anforderung oder Eigenschaft der Angemessenheit erfüllt. Indem wir sicherstellen, dass es diese Anforderung erfüllt, stellen wir sicher, dass diese (statistische) Funktion, die es uns ermöglicht, die Informationen (das mittlere Einkommen) zu synthetisieren, alle in der Stichprobe (die 1.000 Familien) enthaltenen Informationen verwendet.

Warum ist es wichtig, dass ich alle Informationen in der Probe verwende?

Da wir nun wissen, dass der Stichprobenmittelwert eine ausreichende Statistik ist, nehmen wir einen Fall an. Welchen Sinn macht es, das Durchschnittseinkommen auf Basis dieser 1.000 chilenischen Familien berechnen zu wollen und nur die Daten von 500 Familien zu verwenden?

Es würde natürlich keinen Sinn machen. Wir wollen eine Zusammenfassung aller Informationen. Das heißt, was wir als ausreichende Statistik definiert haben.