T-Test (Definition, Typen) - Schritt für Schritt Berechnungsbeispiele

Inhaltsverzeichnis

Was ist T-Test?

Ein T-Test ist eine Methode, mit der eine Schlussfolgerung in der Statistik abgeleitet werden kann, um herauszufinden, ob zwischen zwei Mitteln, bei denen die beiden betrachteten Gruppen miteinander in Beziehung stehen können, ein wesentlicher Unterschied besteht.

Erläuterung

  • Es zielt auf das Testen von Hypothesen ab, das im Wesentlichen zum Testen einer Hypothese verwendet wird, die sich auf eine bestimmte Population bezieht. Ein T-Test berücksichtigt T-Statistiken, T-Verteilungswerte und Freiheitsgrade, die zur Bestimmung der Differenzwahrscheinlichkeit zwischen zwei Datensätzen verwendet werden.
  • Die grundlegende Arbeit hinter T-Test besteht darin, dass eine Stichprobe aus jedem der beiden Sätze berücksichtigt und eine Problemstellung erstellt wird, indem eine Nullhypothese betrachtet wird, bei der beide Mittelwerte als gleich angegeben werden.
  • Auf der Grundlage gleichgestellter Formeln werden Werte gezogen und mit den Standardwerten verglichen, was ferner zur Annahme oder Ablehnung der Nullhypothese führt. Die Ablehnung der Nullhypothese zeigt an, dass der Datensatz ziemlich genau und nicht zufällig ist.

Arten von T-Test

Es gibt hauptsächlich vier Arten von T-Tests:

# 1 - 1-Proben-T-Test

Ziel ist es zu testen, ob der Mittelwert des angestrebten Werts dem Mittelwert einer einzelnen Population entspricht, z. B. zu testen, ob das Durchschnittsgewicht von Schülern der Klasse 5 mehr als 45 kg beträgt

# 2 - 2-Proben-T-Test

Ziel ist es zu testen, ob der Mittelwert des Zielwerts gleich dem Mittelwert zweier unabhängiger Bevölkerungsgruppen ist, z. B. zu testen, ob sich das Durchschnittsgewicht von Jungen der Klasse 5 von Mädchen der Klasse 5 unterscheidet.

# 3 - Gepaarter T-Test

Ziel ist es zu testen, ob der Mittelwert des angestrebten Wertes gleich dem Mittelwert der Unterschiede zwischen den abhängigen Beobachtungen ist. Wenn wir beispielsweise die Noten von Schülern vor und nach dem Unterricht für jedes Fach vergleichen, können wir feststellen, ob der Unterricht von Studiengebühren signifikant genug ist, um die Noten der Schüler zu verbessern.

# 4 - T-Test im Regressionsausgang

Es berücksichtigt den Koeffizienten in der Regressionsgleichung und prüft, inwieweit er vom Nullwert abweicht. Beispiel: Wenn die Punktzahl der Aufnahmeprüfung ein wesentlicher Faktor ist, um zu bestimmen, ob ein Schüler eine gute Endnote erhält.

Annahmen des T-Tests

  • Die erste Annahme für einen t-Test bezieht sich auf die Messskala. Dies hängt damit zusammen, ob die Skala einer kontinuierlichen oder einer ordinalen Skala folgt
  • Die zweite Annahme kann sich auf die Zufälligkeit der Stichprobe beziehen. Dies bedeutet, dass die gesammelten Daten rein zufälliger Natur sein sollten.
  • Die dritte Annahme kann sein, dass wenn wir die Daten in Bezug auf die t-Test-Verteilung zeichnen, sie einer Normalverteilung folgen und einen Glockenkurvengraphen erzeugen sollten.
  • Die vierte Annahme kann sein, dass wir für die t-Verteilung und speziell um eine Form der Glockenkurve zu erhalten, eine größere Stichprobe benötigen.
  • Die endgültige Annahme kann die für den t-Test sein. Die Varianz sollte homogen sein. e. Die Standardabweichungen sind nahezu gleich.

Wie man rechnet?

Es funktioniert in zwei verschiedenen Szenarien, dh einem für die unabhängige Stichprobe und einem für die abhängige Stichprobe.

# 1 - Unabhängiges Beispielszenario

  • Wir müssen die Summe, die Stichprobengröße, die durch „N“ bestimmt wird, und den Bewertungswert für den Mittelwert für jede der unabhängigen Stichproben berechnen. Danach muss der Freiheitsgrad für jede unabhängige Stichprobe berechnet werden.
  • Dies wird dargestellt, indem die Stichprobe um eins subtrahiert wird, was wir als "n-1" bezeichnen. Danach müssen die Varianz und die Standardabweichung berechnet werden.
  • Die Freiheitsgrade der Proben werden addiert und dies wird als "df-total" bezeichnet. Als nächstes müssen wir den Freiheitsgrad jeder Probe mit der Varianz jeder Probe multiplizieren. Wir müssen die Resultierenden addieren und dann die Summe durch "df-total" teilen. Das erhaltene Ergebnis wird als gepoolte Varianz bezeichnet.
  • Die gepoolte Varianz wird dann durch das n der Proben geteilt. Das für alle Proben erhaltene Ergebnis wird dann addiert. Die Quadratwurzel davon wird gezogen, und dies wird als Standardfehler der Differenz bezeichnet.
  • Zuletzt müssen wir den unteren Mittelwert der Stichprobe vom größeren Mittelwert der Stichprobe subtrahieren. Die erhaltene Differenz wird dann durch den Standardfehler der Differenz geteilt, und die erhaltenen Ergebnisse werden als T-Wert bezeichnet.

# 2 - Abhängiges Beispielszenario

  • Die aus jedem Datensatzpaar erhaltenen Bewertungen werden notiert, und wir müssen sie subtrahieren. Die erhaltenen Differenzen werden addiert und als "D" bezeichnet. Die Unterschiede jeder Probe werden quadriert und addiert, um ein Ergebnis zu erhalten, das als "D-Quadrat" bezeichnet wird. Danach müssen wir das "N" oder die Anzahl der Punkte multipliziert mit dem "D-Quadrat" multiplizieren.
  • Das erhaltene Ergebnis wird vom Quadrat der Summe "D" abgezogen. Dieses Ergebnis wird weiter mit "N-1" geteilt. Die Quadratwurzel des Resultierenden wird erhalten und als Teiler bezeichnet. Zuletzt müssen wir das gesamte „D“ durch den Divisor dividieren, wodurch wir den endgültigen t-Wert erhalten.

T-Test Beispiele

Nehmen wir an, wir haben Punktzahlen für jedes Fach in der Prüfung für zwei Semester.

Schritt 1: Subtrahieren Sie Phase 1 von Phase 2

Schritt 2: Addieren Sie den gesamten Unterschied, dh -55

Schritt 3: Quadrieren Sie die Unterschiede

Schritt 4: Addieren Sie alle Differenzquadrate, dh 983

Schritt 5: Verwendung der Formel zur Berechnung des T-Werts

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N.
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / 15,96
  • = -9,16 / 3,99
  • T-Wert = -2,29

Der erhaltene T-Wert wird dann mit dem aus der Tabelle erhaltenen T-Wert unter Verwendung des p-Werts und des Freiheitsgrades verglichen. Wenn der berechnete t-Wert bei einem bestimmten vordefinierten Alpha-Level größer als der Tabellenwert ist, können wir die Nullhypothese ablehnen, dass es einen Unterschied zwischen den Mitteln gibt.

Wann wird es verwendet?

Dies wird verwendet, um zwei Mittelwerte oder Proportionen zu vergleichen. Außerdem verwenden wir einen T-Test, wenn die Populationsparameter dem Benutzer unbekannt sind. Es gibt im Allgemeinen drei Fälle der Verwendung von T-Test-Szenarien:

  • Ein unabhängiger Stichproben-T-Test wird verwendet, wenn der Mittelwert zweier Gruppen verglichen werden soll.
  • Ein gepaarter Stichproben-T-Test wird verwendet, wenn wir den Mittelwert derselben Gruppe zu unterschiedlichen Zeitpunkten vergleichen möchten.
  • Ein Stichproben-T-Test wird verwendet, wenn der Mittelwert einer einzelnen Gruppe mit einem unbekannten Mittelwert verglichen werden muss.

T-Test-Verwendung in Excel

  • In Excel ist das erste und wichtigste, was wir brauchen, die Installation eines Add-Ins namens Datenanalyse. Danach müssen wir auf der Menüregisterkarte zu „Daten“ gehen und darauf klicken. Dort wird die Option „Datenanalyse“ angezeigt.
  • Um einen T-Test durchzuführen, müssen unsere Daten in einem Spaltenformat vorliegen. Wenn Sie auf "Datenanalyse" klicken, erhalten Sie eine Reihe statistischer Tests, die wir durchführen können. Aus der Liste müssen Sie einen T-Test auswählen und auf "OK" klicken.
  • Es erscheint ein Dialogfeld, in dem wir die Daten für Spur 1 in das Feld für den variablen Bereich 1 und die Daten für Versuch 2 in das Feld für den variablen Bereich 2 eingeben müssen. Standardmäßig bleibt der Wert von Alpha bei 0,05, dies kann jedoch nach unseren Wünschen geändert werden. Wenn alles in Ordnung ist, klicken Sie auf "OK".
  • Wir können jetzt das Ergebnis unseres T-Tests auf dem Excel-Blatt sehen. Der wichtigste zu beachtende Wert ist der P-Wert. Wenn unser P-Wert in Excel kleiner als der Alpha-Wert ist, können wir aus der Auswahl unseres Alpha-Werts schließen, dass zwischen den Mitteln unserer beiden Wertesätze ein statistischer materieller Unterschied besteht.

Fazit

Der T-Test zielt auf das Testen von Hypothesen ab, das im Wesentlichen zum Testen einer Hypothese verwendet wird, die sich auf eine bestimmte Population bezieht. Es gibt Auskunft über das Signifikanzniveau des Unterschieds zwischen den Gruppen, die im Allgemeinen anhand des Mittelwerts gemessen werden. Hier finden wir grundsätzlich den Unterschied zwischen Bevölkerungsmitteln und einem hypothetischen Wert heraus.

Interessante Beiträge...