Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (2024)

Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (1)

In diesem Artikel sollen die drei wichtigen Verteilungen erläutert werden, mit denen jeder Datenwissenschaftler vertraut sein muss:

  1. Student T Verteilung

3. F Verteilung

Alle drei Verteilungen sind eng miteinander verbunden. Ich werde versuchen, die Verteilungen auf vereinfachte Weise zu erklären.

In diesem Abschnitt werden die Leser in die Student-T-Distribution eingeführt

Student-T ist eine der wichtigsten statistischen Verteilungen, die es zu verstehen gilt. Es ist auch als T-Verteilung bekannt.

Die Verteilung von Studenten wird in der Welt der Statistik stark genutzt. Insbesondere wenn die Stichprobengröße klein ist und / oder die Populationsstandardabweichung unbekannt ist. Außerdem ist es wichtig, dass die Verteilung eine glockenförmige Kurve hat. Die Verteilung der Schüler kann uns helfen, aussagekräftige statistische Informationen aus der Stichprobe zu erhalten. Darüber hinaus wird es zur statistischen Inferenz verwendet.

Die Student-T-Verteilung wird verwendet, wenn wir keinen großen Stichprobensatz haben, ~ 30 Beobachtungen oder wenn die Standardabweichung der Population nicht verfügbar ist

Student T gilt als eine der größten Durchbruchverteilungen in der Statistik. Es kann verwendet werden, um aus kleineren Stichproben auf die Bedeutung zu schließen, wenn die Standardabweichung der Population unbekannt ist. Dies kann auf eine große Anzahl von Weltproblemen angewendet werden.

Die t-Verteilung der Schüler ist eine Annäherung an die Normalverteilung

Wenn wir die Student T-Verteilung zeichnen, sieht sie einer glockenförmigen Kurve sehr ähnlich. Daher ähnelt die Schülerverteilung einer Normalverteilung. Darüber hinaus liegen die Eigenschaften der t-Verteilung näher an der Normalverteilung. Der Mittelwert der Verteilung ist beispielsweise 0.

Der wichtigste zu beachtende Punkt ist, dass die Schüler-t-Verteilung dickere Schwänze aufweist als die Normalverteilung. Dies bedeutet, dass die Variablen stärker gestreut sind.

Die wichtigste Komponente sind die Freiheitsgrade, die immer 1 minus der Anzahl der Proben sind.

Nehmen wir an, wir sammeln N unabhängige Beobachtungen aus einer normalverteilten Population. Wir können die Verteilung in die student-t-Verteilung konvertieren, indem wir die Formel anwenden:

Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (2)

Was wir tun müssen, ist, den Bevölkerungs- und Stichprobenmittelwert zusammen mit der Standardabweichung der Stichprobe zu erhalten. In der obigen Gleichung ist die Population normal verteilt, hat einen Mittelwert M und eine Standardabweichung S mit n-1 Freiheitsgraden (df), wobei n die Größe der Probe ist.

Je größer die Stichprobe ist, desto näher konvergiert die Student T-Verteilung gegen die Normalverteilung. Der Median der T-Verteilung ist 0.

Mit zunehmenden Freiheitsgraden konvergiert die Verteilung gegen die Normalverteilung. Dies entspricht dem zentralen Grenzwertsatz.

Diese Skizze zeigt die Wahrscheinlichkeitsverteilungskurve der Normalverteilung und der Student-t-Verteilung:

Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (3)

Student-t ist um 0 symmetrisch. Es hat einen niedrigeren Peak als die Normalverteilung und dickere Schwänze. Dies bedeutet, dass die Probe eine höhere Dispersion aufweist.

Wenn wir davon ausgehen, dass unsere Variable eine Student t-Verteilung hat, bedeutet dies, dass die Wahrscheinlichkeit, dass wir einen Wert erhalten, der vom Mittelwert abweicht, höher ist als bei Verwendung einer Stichprobe, die mit der Normalverteilung erstellt wurde .

In diesem Abschnitt wird die Chi-Quadrat-Verteilung vorgestellt. Es wird als Kai-Quadrat-Verteilung ausgesprochen.

Das Wort Quadrat ist wichtig, da es das Quadrieren der Normalverteilung bedeutet. Ich werde seine Bedeutung auch in diesem Artikel erläutern.

Chi-Quadrat ist eine kontinuierliche Wahrscheinlichkeitsverteilung. Es wird auch stark in der statistischen Inferenz verwendet. Wir verwenden die Chi-Quadrat-Verteilung, wenn wir an Konfidenzintervallen und deren Standardabweichung interessiert sind.

Genau wie die Schüler-t-Verteilung ist auch die Chi-Quadrat-Verteilung eng mit der Standardnormalverteilung verbunden.

Nehmen wir an, wir erfassen Daten für N (eine Zahl> 1) unabhängige Zufallsvariablen mit einer Standardnormalverteilung. Jede der Zufallsvariablen hat eine σ-Standardabweichung.

Wenn wir die Verteilungen quadrieren und summieren, hat die Quadratsumme der Verteilungen die Chi-Quadrat-Verteilung mit N Freiheitsgraden.

Da wir die Normalverteilung quadrieren, ist die Chi-Quadrat-Verteilung immer größer als 0, da alle negativen Werte quadriert sind.

Es ist wichtig zu beachten, dass der Mittelwert der Verteilung gleich den Freiheitsgraden ist.

Jede Zufallsvariable hat einen Freiheitsgrad von 1.

Wenn wir die Freiheitsgrade erhöhen, ähnelt die Verteilung der Standardnormalverteilung. Wenn wir jedoch die Verteilungswerte quadrieren, wird die Chi-Quadrat-Verteilung immer zur rechten Seite der y-Achse verschoben, da die Negative in der Verteilung nicht vorhanden sind. Anschließend wird die rechte Schiefe verringert, wenn weitere Zufallsvariablen hinzugefügt werden. Dies ist wiederum auf den zentralen Grenzwertsatz zurückzuführen.

Die Varianz und der Mittelwert nehmen auch zu, wenn die Freiheitsgrade erhöht werden.

Diese Skizze zeigt, wie die Chi-Quadrat-Verteilung aussieht:

Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (4)

Die Fläche unter der Kurve ist immer gleich 1.

In diesem Abschnitt werden die Grundlagen der F-Verteilung erläutert.

Die F-Verteilung ist eine der wichtigsten statistischen Verteilungen, die ebenfalls zu verstehen sind. Es ist sehr eng mit der Chi-Quadrat-Verteilung verwandt, daher habe ich es nach der Chi-Quadrat-Verteilung erklärt. Es ist auch wichtig zu beachten, dass die F-Verteilung zwei verschiedene Arten von Freiheitsgraden aufweist. Der erste Freiheitsgrad im Zähler und der zweite Typ ist der Nennerfreiheitsgrad.

Nehmen wir an, dass es zwei unabhängige Zufallsvariablen gibt. Die erste Zufallsvariable A hat dA-Freiheitsgrade und die zweite Zufallsvariable B hat einen dB-Freiheitsgrad. Betrachten wir auch, dass beide Zufallsvariablen eine Chi-Quadrat-Verteilung hatten. Denken Sie daran, Chi-Quadrat-Verteilung ist, wenn die Zufallsvariable eine Normalverteilung hat und ihre Werte quadriert werden.

Das Verhältnis der Verteilung über ihre Freiheitsgrade hat eine F-Verteilung mit Freiheitsgraden dA (Zähler) und dB (Nenner).

Die F-Verteilung wird verwendet, wenn wir die Variation der Varianzen von zwei Proben bewerten möchten. Wenn wir uns die Darstellung der F-Verteilung mit zunehmenden Freiheitsgraden ansehen, ähnelt das Diagramm stark der Chi-Quadrat-Verteilung.

Außerdem sind die Verteilungen rechtwinklig. Wenn wir die Freiheitsgrade auf dem Zähler erhöhen, verringert sich die Rechtsschiefe. Mittelwert der F-Verteilung = dB / dB-1.

Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (5)

Wir können feststellen, dass die Kurve der Verteilung von den Freiheitsgraden abhängt. Es ist positiv verzerrt, was darauf hinweist, dass der Mittelwert größer als der Median ist.

Es ist wichtig, Statistiken und Wahrscheinlichkeiten zu verstehen. Wenn Sie mit dem Thema und den Distributionen noch nicht vertraut sind, lesen Sie diesen Artikel:

In diesem Artikel wurden die drei wichtigen statistischen Verteilungen erläutert:

Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (6)

  1. Student-t-Verteilung

3. F Verteilung

Wahrscheinlichkeit und Statistik verstehen: Chi-Quadrat-, Student-T- und F-Verteilungen (2024)
Top Articles
Latest Posts
Article information

Author: Dean Jakubowski Ret

Last Updated:

Views: 6456

Rating: 5 / 5 (70 voted)

Reviews: 93% of readers found this page helpful

Author information

Name: Dean Jakubowski Ret

Birthday: 1996-05-10

Address: Apt. 425 4346 Santiago Islands, Shariside, AK 38830-1874

Phone: +96313309894162

Job: Legacy Sales Designer

Hobby: Baseball, Wood carving, Candle making, Jigsaw puzzles, Lacemaking, Parkour, Drawing

Introduction: My name is Dean Jakubowski Ret, I am a enthusiastic, friendly, homely, handsome, zealous, brainy, elegant person who loves writing and wants to share my knowledge and understanding with you.