Die Freiheitsgrade sind die Kombination aus der Anzahl der Beobachtungen in einem Datensatz, die zufällig und unabhängig variieren, abzüglich der Beobachtungen, die von diesen willkürlichen Werten abhängig sind.
Mit anderen Worten, die Freiheitsgrade sind die Anzahl der rein freien Beobachtungen (die variieren können), wenn wir die Parameter schätzen.
Wir unterscheiden hauptsächlich zwischen Statistiken, die Populations- und Stichprobenparameter verwenden, um ihre Freiheitsgrade zu kennen. Wir diskutieren die Unterschiede zwischen dem Mittelwert und der Standardabweichung, wenn die Parameter Grundgesamtheit oder Stichprobe sind:
Populations- und Probenparameter
- Populationsparameter:
Da wir in den Populationen nicht alle Werte kennen, werden die Freiheitsgrade alle Elemente der Population sein: N.
Beide Statistiken erlauben, dass alle Beobachtungen im Set zufällig sind, und daher erhalten wir jedes Mal, wenn wir die Statistik schätzen, unterschiedliche Ergebnisse. Dann sind die Beobachtungen, die das volle Recht zur Variation haben, alle Beobachtungen der Grundgesamtheit. Mit anderen Worten, die Freiheitsgrade sind in diesem Fall alle Elemente der Grundgesamtheit: N. Aus diesem Grund dividieren wir beide Statistiken durch die Gesamtgröße der Grundgesamtheit (N).
- Beispielparameter (Schätzungen):
In den Beispielen kennen wir alle Werte.
Wir unterscheiden die Größe der Grundgesamtheit (N) mit der Größe der Stichprobe (n).
Da wir alle Werte in den Stichproben kennen, können wir den Mittelwert problemlos berechnen, da alle Beobachtungen in der Menge zufällig sind.
Bei der Standardabweichung schränken wir die Freiheitsgrade ein: alle Elemente der Stichprobe (n) und wir ziehen 1 Element ab.
Aber … Warum ziehen wir nur 1 und nicht 5 oder 10 Elemente von der Probe (n) ab?
Je mehr Elemente wir subtrahieren, desto mehr Informationen haben wir über den Stichprobenparameter, in diesem Fall die Standardabweichung.
Je mehr Informationen wir haben, desto weniger Freiheiten (Freiheitsgrade) müssen die Stichprobenbeobachtungen zufällige Werte annehmen. Je mehr Elemente wir von der Probe subtrahieren, desto mehr Beschränkungen legen wir fest und desto weniger Freiheitsgrade haben die Probenparameter.
Beispiel
Wir nehmen an, dass wir nach Andorra fahren, um das Ski-Weltcup-Finale zu sehen, weil wir den alpinen Skisport wirklich mögen. Wir bringen eine Karte mit, die uns verrät, wo sich die verschiedenen Disziplinen befinden und die Namen einiger Teilnehmer, aber die Startnummer jedes Teilnehmers ist nicht angegeben. Jedes Mal, wenn sie den Namen des Konkurrenten sagen, kratzen wir seinen Namen. Da die Teilnehmerliste begrenzt ist, werden wir irgendwann den Namen der Teilnehmer kennen, bevor sie ihn über die Lautsprecher bekannt geben.
Wir analysieren die Chronik aus mathematischer Sicht:
- Stichprobengröße (n), weil sie uns nur den Namen eines Teils der Teilnehmer nennen.
- Jeder Teilnehmer kann nach dem Zufallsprinzip starten, die Reihenfolge spielt keine Rolle und kann nicht erneut antreten (Kombinationen ohne Wiederholungen).
- Der letzte Teilnehmer ist das bekannte Element (n-1). Dann können alle anderen Teilnehmer zufällig herauskommen, außer dem letzten, den wir sicher kennen.
Lesen Sie das Beispiel der Freiheitsgrade